Вопрос

Я использую Tesseract для моего проекта распознавания письма и в настоящее время признания довольно хорошие. Часть обработки изображений была сделана с использованием библиотек OpenCV. Письма рукописны. Но есть некоторые проблемы, когда я использовал его, чтобы распознать письмо «O» и номер «0». Эти буквы используются в области данных в качестве полей, которые вводят в имена. Таким образом, имена не могут иметь никаких номеров с ним. И когда мы используем систему полей данных в виде даты рождения, содержит только номера. Поэтому я готов дать ограничение в систему распознавания, говоря, что соответствующие поля данных имеют только цифры или буквы.

А также готов просмотреть признанные буквы с возможными словами, чтобы мы могли улучшить точность данных. Я готов использовать библиотеки OpenCV для этой задачи. Но я не знаю, каковы библиотеки, которые помогают для этой задачи и каковы функции тех. Поэтому, пожалуйста, можете помочь мне. Спасибо.

С уважением, ТИЛЬАНКА.

Это было полезно?

Решение

Я никогда не использовал Tesseract. Однако, в FAQ он говорит

Как я узнаю только цифры?

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

Предположительно, вы можете использовать шаблон записи FAQ, чтобы настроить его, поэтому он распознает только буквы или только правильно цифры.

Если вы уже попробовали это, можете ли вы дать больше деталей, почему это не работает?

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top