Linux 上の OCRopus/Tesseract による Fraktur 認識
質問
ocropusでfraktur書体のドイツ語テキストの認識を実行しようとしていますが、deu-fパッケージを使用していないようです。
私が実行した手順は次のとおりです。
- tesseract と ocropus をコンパイルしてインストールしました。
- ダウンロード済み http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gz, 、tessdata/に解凍しました。
でも電話すると
$ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png
結果は電話したときと同じです
$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png
何が問題なのか何か考えはありますか?
解決
問題は http://code.googleに記載されています。 COM / P / ocropus /問題/詳細?ID = 87 に。ただ、ocropusし、それを再構築するためにパッチを適用する必要があります。
所属していません StackOverflow