Вопрос

Я ищу объяснение / API DOC / примеры того, как использовать (и тренировать?) Тессеракт в C ++, ничего полезного на странице Google Tesseract, и все же, чтобы найти что -то в Интернете.

Любой полезные источники, опыт был бы более чем приветствуюсь, так как я понятия не имею, как начать с этого.

PS:

  1. Я открыт для предложений по другим библиотекам.
  2. Только БЕСПЛАТНО библиотеки
Это было полезно?

Решение

У меня есть некоторый опыт работы с Tesseract ... простой Google of Training Tesseract »раскрывает эту страницу:http://code.google.com/p/tesseract-ocr/wiki/trainingTesserActТам, где вы должны выбрать, какую версию Tesseract вы хотите тренировать. В то время как 3 - последняя версия, она совершенно новая, и, таким образом, люди все еще сглаживают любые проблемы - я все еще использую версию 2.4. В любом случае, вы увидите около 9 шагов в обучении Tesseract для конкретного «языка» (или того, что должно было быть названо «шрифтами» или «наборами символов»). Вы также можете просто использовать существующий язык «ENG» - но это зависит от вашего приложения. Например, в моем приложении я должен был бы провести анализ документов, взять определенный регион и хотел бы показать 13 -характерную серию чисел - и мне нужна была высокая точность - и я не хотел, чтобы он читал '5' как ' S 'и' 0 'как' o 'и т. Д., поэтому было логично создать определенный «язык» моего конкретного набора шрифтов, состоящего только из символов 0..9, тогда как вам может быть наплевать, если вы получите дополнительный «шум

Другие советы

Tesseract OCR является библиотекой с открытым исходным кодом для обнаружения оптического характера. Вам просто нужно включить файлы библиотеки, если вы используете Visual Studio. Если вы используете Creator QT, вам нужно построить библиотеку для работы над QT. Вам нужно использовать Cmakelist или Cmake Gui для построения библиотеки. Вы можете посетить ссылкуOpencv ocr сборка для QT 5.4 Mingw

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top