Ad-hoc-Wörterbuch

https://stackoverflow.com//questions/25047110

21-12-2019
|

Frage

i m arbeitet derzeit an einem kleinen Projekt mit FineReader 11 SDK.Um meine Ergebnisse zu verbessern, arbeite ich gerne mit einem Ad-hoc-Wörterbuch.Der Inhalt des Wörterbuchs basiert auf dem ersten Wort einer bestimmten Zeile

Beispiel:

generasacodicetagpre.

Meine Idee ist es, das erste Wort (Samsung oder Apple) umzusetzen und das Wörterbuch mit allen möglichen Wörtern zu füllen, die auf der ersten (für Samsung: Galaxie, S3, ...)

jede idee, wie man das mit feinereader löst

grüße

Lösung

Vielen Dank für die Klarstellung. Also hier, was Sie meiner Meinung nach tun können. Dies gilt für die FineReader-Produktlinie, und natürlich in der SDK haben Sie über die API mehr spezifischere Steuerung.

feinereader ocr hat diese Wörterbücher:

Integriertes Wörterbuch - Große Reihe von gemeinsamen Wörtern und ihrer Variationen, einer der Stärken der ABBYY OCR-Technologie. Es enthält keine speziellen Wörter, wie zum Beispiel "Samsung" und "S3". Durch Auswahl der beliebten Sprache aktivieren Sie das integrierte Wörterbuch automatisch für diese Sprache.

Benutzerdefiniertes Wörterbuch - Dies ist ein Wörterbuch, das Sie alleine oder in Verbindung mit eingebautem Wörterbuch bauen und verwenden können.

Für Ihr Projekt glaube ich, dass es sinnvoll ist, ein integriertes Wörterbuch zu verwenden, da Ihre Phrasen standardische englische Wörter haben (Sie haben keine vollständigen Sätze für mich zur Verfügung gestellt, um dies zu sehen, also entscheiden Sie sich für dieses selbst). .

Ich glaube auch dringend, dass Sie ein benutzerdefiniertes Wörterbuch mit Marken und Modellen usw. erstellen müssen, wenn Sie diese Option haben, und klingt wie Sie. Es wird die Anerkennung erheblich verbessern, insbesondere für nicht natürliche Wörter, wie "S3", da die gemeinsamen Sprachregeln mit Buchstaben und Zahlen nicht gemischt werden sollten. Dies ist sehr einfach zu tun.

Ich sehe derzeit nicht den Vorteil, jede Zeile mit einem separaten Wörterbuch zu lesen, es sei denn, Sie glauben, dass Sie eine Kreuzung sehr ähnlicher Wörter haben, die auf verschiedene Zeilen anwendbar sind, und Sie möchten diese Wörter in separaten Wörterbüchern und relativ zu jeder Zeile . Dann können Sie separate Wörterbücher erstellen und jedes Wörterbuch für die sekundäre Anerkennung basierend auf dem ursprünglichen Wort einschalten. Um dies zu erreichen, müssen Sie jedoch zunächst in Zeilen (in Speicher oder tatsächlichen Erntebildern) trennen, um jeden separat mit einem einzigartigen Wörterbuch verarbeiten zu können. Das ist nur in SDK mit erheblicher Arbeit möglich.

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow