Quel genre de bibliothèque OCR Java dois-je utiliser dans Android? [fermé]
Question
Je voudrais construire une application Android qui, via une bibliothèque OCR, doit numériser une image extraire le texte de celle-ci.
Quelle bibliothèque Java dois-je utiliser?
La solution
Je ne sais pas comment il est bon (il a vraiment besoin d'être formé en premier), mais il y a bibliothèque Java OCR Ron čemer .
Autres conseils
Si vous êtes à la recherche d'une option très extensible ou avez un domaine de problème spécifique que vous pourriez envisager de rouler votre propre en utilisant Java Object moteur Neural orienté.
Je l'ai utilisé avec succès dans un projet personnel pour identifier la lettre d'une image telle que cette , vous pouvez trouver toutes les sources pour le composant OCR de mon application sur GitHub, ici .
essayer Tesseract, checkout cet article http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html et cet exemple http://code.google.com/p/mezzofanti/
Edit: quelques faits - Tesseract est l'un des meilleurs OCR open source utilisé par Google - il existe des données de formation disponibles pour de nombreuses langues - Mezzofanti est une application Android qui utilise Tesseract - méfiez-vous: OCR n'utilise beaucoup de puissance CPU. essayant d'OCR une page A4 avec votre T-G1 Mob prendra beaucoup de temps et le résultat ne peut pas vous impressionner; -)
Vous pouvez utiliser la fonction OCR de Google Docs. Vérifiez la Documents API Liste des données http: //code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#OCR