Quel logiciel recommanderiez-vous pour améliorer l'image avant OCR (Reconnaissance Optique de Caractères)? [fermé]

https://stackoverflow.com/questions/142743

02-07-2019
|

Question

Nous recherchons actuellement des moyens d’améliorer la qualité de l’image avant de la soumettre à l’OCR. Le moteur OCR que nous utilisons actuellement est l’API Scansoft de Nuance (v15). Nous recherchions les Outils de référence , mais avons depuis décidé de chercher ailleurs. Les coûts de licence associés à Lead Tools sont tout simplement trop élevés. Pour commencer, nous recherchons des fonctionnalités simples d'amélioration de l'image, telles que: redressement, suppression du balayage, suppression des lignes, suppression des perforations, netteté, etc. Nous utilisons une combinaison de logiciels .NET et Java, mais une solution java serait préférable.

La solution

Kofax est bon pour le pré-traitement, mais pour les types de nettoyage dont vous parlez, il peut être excessif à moins que les images ne soient vraiment mauvaises. Si votre spécialité n’est pas le traitement de l’image, nous vous recommandons de faire appel à un fournisseur qui effectue le nettoyage de l’image et l’OCR afin que vous puissiez vous concentrer sur la valeur ajoutée.

Nous avons acquis une licence pour le kit de développement OCR auprès d’ABBYY ( ABBY SDK ). superbe pour le traitement d'image et OCR. L'API est assez étendue et les exemples d'applications, l'aide et le support ont été plus qu'impressionnants. Je recommande vivement de jeter un coup d'oeil.

Autres conseils

Avertissement: je travaille pour Atalasoft

Nous disposons de ces fonctions et de licences d’exécution libres de droits pour .NET.

http://www.atalasoft.com/products/dotimage/

Nous avons également des composants OCR, notamment un wrapper .NET pour Abbyy, Tesseract et autres, ainsi que la génération de PDF indexable (image au-dessus du texte d'un fichier PDF)

Je ne sais pas si cela correspondrait tout à fait aux normes dont vous auriez besoin, mais vous devriez peut-être consulter certaines des Paint.Net API. Je ne sais pas à quel point il serait facile d'extraire leurs algorithmes de traitement d'images pour les utiliser dans votre projet, mais je pense qu'ils réalisent certaines des tâches que vous recherchez. De plus, il s’agit d’un projet open source avec une licence MIT, il devrait donc être relativement convivial pour une utilisation professionnelle.

Recherche sur KOFAX VRS sur KOFAX.com

Peut-être que JMagick est une interface Java à code source ouvert d'ImageMagick. Il est implémenté sous la forme d'une couche JNI (Java Native Interface) mince dans l'API ImageMagick. Il est sous licence LGPL, donc ce ne devrait pas être un problème de licence.

http://sourceforge.net/projects/jmagick/

Je suggère Intel pour ses licences d’exécution à coût nul.

Dépend du nombre et de la qualité des images d'origine. Les trousses d'outils de gestion de code et d'imagerie fonctionneront, mais ce n'est pas toujours la meilleure solution si vous devez traiter plusieurs millions d'images. Pour les petits lots et les budgets restreints, je suis d’accord avec les précédentes affiches pour dire que des projets tels que Aforge, Paint.NET et d’autres bibliothèques de vision par ordinateur à code source libre feraient l'affaire. Bien sûr, vous êtes seul si les résultats ne s'améliorent pas ... Au moins, cela vous permet de regrouper tout ce dont vous avez besoin dans une seule application et à moindre coût.

Si vous traitez plusieurs centaines de milliers d'images par mois, je vous suggère de diviser le processus en une étape de flux de travail plus petite et d'ajuster chacune d'elles jusqu'à ce que votre coût par image soit le plus proche possible de zéro. Vous constaterez que les résultats de l'OCR augmentent rapidement au début, puis se stabilisent plus tôt que prévu. (Je ne suis pas un grand fan d'OCR mais il a sa place)

J'utilise un produit Windows commercial de Recogniform pour traiter et nettoyer les images avant OCR en mode de traitement par lots, à l'aide de scripts adaptés à différents types d'images. Si une image ne répond pas aux critères de qualité ou est rejetée par le moteur OCR, elle est "réparée". manuellement à l'aide d'une application .NET personnalisée créée avec le toolkit d'Atalasoft . Le traitement par lots tout et ne touche que ce qui échoue.

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow