Pregunta

Me gustaría construir una aplicación para Android que, a través de una biblioteca de OCR, debe escanear un texto extrayendo la imagen de ella.

¿Qué biblioteca de Java debe usar?

¿Fue útil?

Solución

No sé lo bueno que es (que sin duda necesita ser entrenado en primer lugar), pero no es de Ron Cemer Java OCR biblioteca .

Otros consejos

Si usted está buscando una opción muy extensible o tiene un dominio de problema específico que podría considerar rodar su propio uso de la Objeto Java orientada motor neural.

Lo utilicé con éxito en un proyecto personal para identificar la carta de una imagen tal como este , se puede encontrar toda la fuente para el componente OCR de mi solicitud en github, aquí .

tratar Tesseract, pago y envío este artículo http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html y este ejemplo http://code.google.com/p/mezzofanti/

Editar: algunos más hechos - Tesseract es uno de los mejores OCR de código abierto utilizado por Google - no hay datos de entrenamiento disponibles para muchos idiomas - Mezzofanti es una aplicación para Android que utiliza Tesseract - cuidado: OCR hace uso de una gran cantidad de energía de la CPU. tratando de OCR de una página A4 con su G1 de T-Mob tendrá una gran cantidad de tiempo y el resultado no puede impresionar; -)

Puede utilizar la función de OCR de Google Docs. Compruebe el Documentos API Lista de datos http: //code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#OCR

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top