我正在寻找有关如何使用(和训练?)Tesseract在C ++中的解释 / API DOC /示例,在Google Tesseract页面上没有任何用处,尚未通过网络找到一些东西。

任何有用的来源,经验都将受到欢迎,因为我不知道如何开始。

PS:

  1. 我愿意就其他图书馆提出建议。
  2. 仅有的 自由
有帮助吗?

解决方案

我在Tesseract方面有一些经验...一个简单的Google“训练Tesseract”揭示了此页面:http://code.google.com/p/tesseract-ocr/wiki/trainingtesseract您必须在哪里选择要训练的泰瑟act版的版本。3是最新版本,但它是全新的,因此人们仍在解决任何问题 - 我仍在使用2.4版。无论如何,您会看到大约有9个步骤在训练特定的“语言”(或应该称为“字体”或“字符集”)中。您也可以只使用现有的“英语”语言 - 但这取决于您的应用程序。例如,在我的应用程序中,我必须进行文档分析并进行特定的区域,并想要一个13个字符的数字字符串 - 我需要高精度 - 我不希望它读取'5'as'as'as'as'as'as'as' s'和'0 as'o'等

其他提示

Tesseract OCR是用于检测光学特征的开源库。如果您使用的是Visual Studio,则只需包含库文件即可。如果您使用的是QT创建者,则必须构建库以在QT上工作。您需要使用cmakelist或cmake GUI来构建库。您可以访问链接OpenCV OCR构建QT 5.4 mingw

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top