Pregunta

Necesito hacer un OCR de una imagen .jpg. Busqué mucho y finalmente obtuve el "Tessnet2". El código se ve bastante simple pero tengo un problema con el ejemplo: L

Cuando trato de iniciar el OCR, mi aplicación deja y no devolvió nada. Depuración, parece que la siguiente línea es donde sale:

ocr.Init("C:\\Desarrollo\\Prueba\\ConsoleApplication1\\tessdata", "spa", false);

El primer parámetro es la ruta con "tessdata" incluida, ¿no es así? La segunda ruta es el lugüege que quiero usar ...

En TessData tengo los 8 archivos que necesita.

¿Qué estoy haciendo mal?

Estoy usando C# y Visual Studio 2010. Cuando trato de compilarlo, recibo un error de .NET Framework (estaba usando 4.0 y necesita 2.0, lo disminuyo y ahora compilo pero tengo ese problema).

¡Gracias!

¿Fue útil?

Solución

Encontré el mismo problema, pero descubrí que había estado usando el archivo de idioma para Tesseract 3.0 (no 2.0). Cuando puse los archivos destinados a 2.0, funcionó.

Dado que también parece estar usando 2.0 SDK, descargue los archivos de idioma para el 2.0 (http://code.google.com/p/tasseract-ocr/downloads/list). Los archivos en la parte superior son para 3.0. Desplácese hasta la parte inferior de la lista.

Otros consejos

Yo también encontré el mismo problema donde el método tessnet2.teSseract OCR = new Tessnet2.Tesseract (); ocr.init ( @"e: qaliber Qaliber-Code-133 Qaliber Engine OCR " + @"TessData ", "Eng", falso);

estaba fallando en el método init (). No me arrojó ningún error, pero la ejecución simplemente salió con el código de salida 1. Para solucionar el problema, descargué archivos de lenguaje ENG de la versión correcta (2.0 para mí) y eliminé todas las claves en el registro donde encontré el palabra clave "tesseract". Luego reinicié la máquina. El programa se ejecuta con éxito ahora. El único problema ahora es que no obtengo el resultado adecuado (la altura es negativa). Le echaré un vistazo. Pero estoy feliz de que al menos mi programa se ejecute.

Mi código funciona bien en otras máquinas pero no funciona en una máquina. Estoy usando VS2010 y Framework 3.5. El control se excita automáticamente desde el siguiente código:

ocr.init (@"d: path", "eng", falso);

Aquí OCR es la instancia de Tesseract ().

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top