Tesseract或任何其他OCR Lib
-
29-09-2019 - |
题
我正在寻找有关如何使用(和训练?)Tesseract在C ++中的解释 / API DOC /示例,在Google Tesseract页面上没有任何用处,尚未通过网络找到一些东西。
任何有用的来源,经验都将受到欢迎,因为我不知道如何开始。
PS:
- 我愿意就其他图书馆提出建议。
- 仅有的 自由 库
解决方案
我在Tesseract方面有一些经验...一个简单的Google“训练Tesseract”揭示了此页面:http://code.google.com/p/tesseract-ocr/wiki/trainingtesseract您必须在哪里选择要训练的泰瑟act版的版本。3是最新版本,但它是全新的,因此人们仍在解决任何问题 - 我仍在使用2.4版。无论如何,您会看到大约有9个步骤在训练特定的“语言”(或应该称为“字体”或“字符集”)中。您也可以只使用现有的“英语”语言 - 但这取决于您的应用程序。例如,在我的应用程序中,我必须进行文档分析并进行特定的区域,并想要一个13个字符的数字字符串 - 我需要高精度 - 我不希望它读取'5'as'as'as'as'as'as'as' s'和'0 as'o'等
其他提示
Tesseract OCR是用于检测光学特征的开源库。如果您使用的是Visual Studio,则只需包含库文件即可。如果您使用的是QT创建者,则必须构建库以在QT上工作。您需要使用cmakelist或cmake GUI来构建库。您可以访问链接OpenCV OCR构建QT 5.4 mingw
不隶属于 StackOverflow