Tesseract或任何其他OCR Lib

https://stackoverflow.com/questions/4314060

29-09-2019
|

题

我正在寻找有关如何使用（和训练？）Tesseract在C ++中的解释 / API DOC /示例，在Google Tesseract页面上没有任何用处，尚未通过网络找到一些东西。

任何有用的来源，经验都将受到欢迎，因为我不知道如何开始。

PS：

我愿意就其他图书馆提出建议。
仅有的自由库

解决方案

我在Tesseract方面有一些经验...一个简单的Google“训练Tesseract”揭示了此页面：http://code.google.com/p/tesseract-ocr/wiki/trainingtesseract您必须在哪里选择要训练的泰瑟act版的版本。3是最新版本，但它是全新的，因此人们仍在解决任何问题 - 我仍在使用2.4版。无论如何，您会看到大约有9个步骤在训练特定的“语言”（或应该称为“字体”或“字符集”）中。您也可以只使用现有的“英语”语言 - 但这取决于您的应用程序。例如，在我的应用程序中，我必须进行文档分析并进行特定的区域，并想要一个13个字符的数字字符串 - 我需要高精度 - 我不希望它读取'5'as'as'as'as'as'as'as' s'和'0 as'o'等

其他提示

Tesseract OCR是用于检测光学特征的开源库。如果您使用的是Visual Studio，则只需包含库文件即可。如果您使用的是QT创建者，则必须构建库以在QT上工作。您需要使用cmakelist或cmake GUI来构建库。您可以访问链接OpenCV OCR构建QT 5.4 mingw

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow