Welche Software würden Sie empfehlen für Bildverbesserung vor der OCR (Optical Character Recognition)? [geschlossen]

https://stackoverflow.com/questions/142743

02-07-2019
|

Frage

Wir sind derzeit die Erforschung Möglichkeiten der Bildqualität zu verbessern, bevor OCR zur Unterwerfung. Der OCR-Engine wir derzeit verwendet werden, ist der Scansoft-API von Nuance (v15). Wir waren die Erforschung der Lead-Werkzeuge aber da sich entschieden haben, an anderer Stelle zu suchen. Die Lizenzkosten mit Blei-Tools verbunden ist, ist einfach zu groß. Zunächst einmal suchen wir für einfache Bildverbesserungsfunktionen wie: Entzerren, Entfernen von Flecken, Linienentfernung, Entfernung von Lochungen, Schärfen, etc. Wir sind eine Mischung aus .NET und Java-Software ausgeführt wird, aber Java-Lösung wäre vorzuziehen.

Lösung

Kofax ist gut für die Vorverarbeitung, sondern auch für die Art der Bereinigung Sie sprechen zu viel des Guten kann, es sei denn die Bilder sind wirklich schlecht. Es sei denn, Ihre Spezialität in der Bildverarbeitung ist, würde ich empfehlen, mit einem Anbieter arbeiten, die die Bildbereinigung und die OCR funktioniert, so dass Sie auf dem Wert konzentrieren können Sie tatsächlich hinzuzufügen.

Wir lizenzieren die Entwicklung OCR-Kit von ABBYY ( ABBY SDK ) und haben es gefunden zu sein hervorragend sowohl für Bildverarbeitung und OCR. Die API ist sehr umfangreich, und die Beispielanwendungen, Hilfe und Unterstützung haben darüber hinaus beeindruckend. Ich empfehle auf jeden Fall einen Blick.

Andere Tipps

Disclaimer: Ich arbeite für Atalasoft

Wir haben diese Funktionen und Laufzeit gebührenfreie Lizenzierung für .NET.

http://www.atalasoft.com/products/dotimage/

Wir haben auch OCR-Komponenten, einschließlich einem .NET-Wrapper für Abbyy, Tesseract und andere und durchsuchbare PDF-Generation (Bild oben auf Text in einer PDF)

Nicht sicher, ob dies den Standards ziemlich hoch sein würde, die euch müssten, aber vielleicht sollten Sie einige der

Forschung über Kofax VRS bei KOFAX.com

Vielleicht JMagick, es ist eine Open-Source-Java-Schnittstelle von ImageMagick. Es ist in der Form einer dünnen Java Native Interface (JNI) Schicht in den ImageMagick-API implementiert. Es ist unter der LGPL lizenziert, so dass es kein Problem Lizenz klug sein sollte.

http://sourceforge.net/projects/jmagick/

Ich würde vorschlagen, Intel seine zero-Cost-Runtime-Lizenzen.

Abhängig von der Anzahl und Qualität der Originalbilder. Managed Code und Imaging-Tool-Kits arbeiten, aber es ist nicht immer die beste Lösung, wenn Sie mehrere Millionen Bilder haved zu verarbeiten. Für Kleinserien und knappe Budgets, ich stimme mit den vorherigen Plakate, die wie Projekte Aforge, Paint.NET und andere Open-Source-Computer-Vision-Bibliotheken wird der Trick. Natürlich können Sie auf eigene Faust, wenn die Ergebnisse nicht verbessern ... Wenigstens legen Sie diese Lassen Sie uns alles, was man für einen geringen Kosten unter einer Anwendung benötigen.

Wenn Sie mehrere hunderttausend Bilder pro Monat verarbeiten, dann würde ich vorschlagen, dass Sie den Prozess in kleinere Workflow-Schritt aufzuteilen und optimieren jede einzelne bis die Kosten pro Bild so nahe kommt auf Null wie möglich. Sie werden feststellen, dass die OCR-Ergebnisse schnell auf dem ersten steigen und dann einpendeln früher als erwartet. (Ich bin kein großer Fan von OCR, aber es hat seinen Platz)

Ich verwende kommerzielles Windows-Produkt von Recogniform verarbeiten und die Bilder vor der OCR in einem Batch-Modus aufzuräumen mit Hilfe von Skripten für verschiedene Arten von Bildern eingestellt. Wenn ein Bild nicht QC oder wird durch die OCR-Engine abgelehnt wird "repariert" von Hand einer benutzerdefinierten .NET-Anwendung gebaut mit Atalasoft des Toolkit. Batch-Prozess alles und nur berühren, was fehlschlägt.

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow