Fraktur Anerkennung mit OCRopus / Tesseract auf Linux
Frage
Ich versuche, die Anerkennung eines Deutsch Text mit Frakturschrift mit ocropus durchzuführen, aber es scheint nicht deu-f-Paket werden.
Hier sind die Schritte, die ich durchgeführt.
- kompiliert und installiert tesseract und ocropus.
- http: // tesseract-ocr. googlecode.com/files/tesseract-2.01.deu-f.tar.gz , entpackt es /.
Aber wenn ich rufe
$ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png
Die Ergebnisse sind die gleichen wie wenn ich rufe
$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png
Irgendwelche Ideen, was das Problem ist?
Lösung
Das Problem ist in der http://code.google. com / p / ocropus / Themen / detail? id = 87 . müssen nur den Patch anwenden OCRopus und es wieder aufzubauen.
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow