Frage

Ich bin mit Tesseract in einem meiner Anwendungen, und ich habe Schwierigkeiten beim Zugang zu perfekten Ergebnissen. Als ich die Bibliothek auf einem perfekten Screenshot verwenden, wird es den größten Teil des Textes und das ist in Ordnung. Aber wenn ich es auf ein Foto, zum Beispiel verwenden, hat es Probleme arbeiten Sie es aus, und manchmal wird es nicht einmal etwas zurück.

Ich weiß, Sie Tesseract trainieren kann, ist es ein gutes Training Tutorial oder etwas für iPhone Foto Anerkennung? Oder gibt es irgendwelche Änderungen soll ich meine Quelle Bild machen, bevor es die Verarbeitung?

Danke!

War es hilfreich?

Lösung

Post eine Probe pic. Hier sind einige Dinge zu sehen:

Wie bekommen Sie das Bild 1-Bit? Letztlich wird OCR in B / W Bildern gemacht - vielleicht können Sie einen besseren Job als die Bibliothek tun.

Was ist die DPI des Bildes? Scans sind in der Regel etwa 200-300 DPI, aber Fotos können 72 oder 96 OCR-Engines auf DPI aussehen werden ein Gefühl für die Größe der Buchstaben zu bekommen. Möglicherweise müssen Sie die DPI und resample (Resize), um das Bild zu ändern, so dass die DPI Erwartungen entspricht. OCR-Engines erwartet gescannte Dokumente, keine Fotos.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top