reconocimiento fraktur con OCRopus / Tesseract en Linux
Pregunta
Estoy tratando de realizar el reconocimiento de un texto alemán con el tipo de letra fraktur con OCRopus pero no parece estar utilizando el paquete deu-f.
Estos son los pasos que realicé.
- compilado e instalado Tesseract y OCRopus.
- http: // tesseract-ocr. googlecode.com/files/tesseract-2.01.deu-f.tar.gz , desempaquetado a tessdata /.
Pero cuando llamo
$ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png
los resultados son los mismos que cuando llamo
$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png
¿Ideas cuál es el problema?
Solución
El problema se describe en http://code.google. com / p / OCRopus / temas / detalle? id = 87 . Sólo hay que aplicar el parche a OCRopus y reconstruirlo.
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow