reconocimiento fraktur con OCRopus / Tesseract en Linux

https://stackoverflow.com/questions/1867632

ocr
tesseract

18-09-2019
|

Pregunta

Estoy tratando de realizar el reconocimiento de un texto alemán con el tipo de letra fraktur con OCRopus pero no parece estar utilizando el paquete deu-f.

Estos son los pasos que realicé.

compilado e instalado Tesseract y OCRopus.
http: // tesseract-ocr. googlecode.com/files/tesseract-2.01.deu-f.tar.gz , desempaquetado a tessdata /.

Pero cuando llamo

 $ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png

los resultados son los mismos que cuando llamo

$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png

¿Ideas cuál es el problema?

Solución

El problema se describe en http://code.google. com / p / OCRopus / temas / detalle? id = 87 . Sólo hay que aplicar el parche a OCRopus y reconstruirlo.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow