OCR y la palabra de revisión

https://stackoverflow.com/questions/2396085

25-09-2019
|

Pregunta

Estoy usando Tesseract para mi proyecto de reconocimiento de las letras y en la actualidad los reconocimientos es bastante bueno. La parte de procesamiento de imágenes se realizó utilizando librerías OpenCV. Las letras son mano written.But hay algunos problemas cuando lo usé para reconocer la letra "O" y el número "0". Estas cartas se utilizan en áreas de datos como los campos que entran nombres. Así que los nombres no pueden tener cualquier número con él. Y cuando estamos utilizando el sistema de los campos de datos como la fecha de nacimiento que sólo contiene números. Así que estoy dispuesto a dar restricción al sistema de reconocimiento diciendo que los campos de datos correspondientes tienen sólo números o las letras.

Y también estoy dispuesto a revisar las cartas reconocidas con las palabras posibles para que podamos mejorar la exactitud de los datos. Estoy dispuesto a usar las librerías OpenCV para esta tarea. Pero no sé lo que son las bibliotecas que ayuda para esta tarea y cuáles son las funcionalidades de los. Así que por favor puede alguien me ayuda. Gracias.

Saludos, Thilanka.

Solución

Nunca he usado Tesseract. Sin embargo, en el FAQ dice

¿Cómo puedo reconocer sólo dígitos?

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

Es de suponer que podría utilizar el patrón de la entrada de la FAQ para configurarlo de manera que sólo reconoce las letras o simplemente dígitos adecuadamente.

Si ya ha intentado esto, se puede dar más detalles de por qué no funciona?

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow