题
我试图进行识别的德语文本德文尖角字体的字样与ocropus但它似乎不会使用deu-f包。
下面是步骤,我进行的。
- 编译并安装了魔方和ocropus.
- 下载 http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gz, 解包给tessdata/.
但当我打电话
$ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png
结果是相同的,当我打电话
$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png
任何想法什么问题吗?
解决方案
问题是描述 http://code.google.com/p/ocropus/issues/detail?id=87.只需要适用贴片ocropus和重建。
不隶属于 StackOverflow