reconnaissance Fraktur avec ocropus / Tesseract sur Linux
Question
Je suis en train d'effectuer la reconnaissance d'un texte allemand avec caractères de fraktur avec ocropus mais il ne semble pas être en utilisant package deu-f.
Voici les étapes que j'effectuées.
- Compilé et installé Tesseract et ocropus.
- http: // tesseract-ocr. googlecode.com/files/tesseract-2.01.deu-f.tar.gz , décompressé à tessdata /.
Mais quand je l'appelle
$ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png
les résultats sont les mêmes que quand je l'appelle
$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png
Toutes les idées que le problème est?
La solution
Le problème est décrit dans http://code.google. com / p / ocropus / questions / détail? id = 87 . Juste besoin d'appliquer le patch pour ocropus et reconstruire.
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow