Question

Je voudrais construire une application Android qui, via une bibliothèque OCR, doit numériser une image extraire le texte de celle-ci.

Quelle bibliothèque Java dois-je utiliser?

Était-ce utile?

La solution

Je ne sais pas comment il est bon (il a vraiment besoin d'être formé en premier), mais il y a bibliothèque Java OCR Ron čemer .

Autres conseils

Si vous êtes à la recherche d'une option très extensible ou avez un domaine de problème spécifique que vous pourriez envisager de rouler votre propre en utilisant Java Object moteur Neural orienté.

Je l'ai utilisé avec succès dans un projet personnel pour identifier la lettre d'une image telle que cette , vous pouvez trouver toutes les sources pour le composant OCR de mon application sur GitHub, ici .

essayer Tesseract, checkout cet article http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html et cet exemple http://code.google.com/p/mezzofanti/

Edit: quelques faits - Tesseract est l'un des meilleurs OCR open source utilisé par Google - il existe des données de formation disponibles pour de nombreuses langues - Mezzofanti est une application Android qui utilise Tesseract - méfiez-vous: OCR n'utilise beaucoup de puissance CPU. essayant d'OCR une page A4 avec votre T-G1 Mob prendra beaucoup de temps et le résultat ne peut pas vous impressionner; -)

Vous pouvez utiliser la fonction OCR de Google Docs. Vérifiez la Documents API Liste des données http: //code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#OCR

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top