Вопрос

Я использую Tesseract в одном из моих приложений, и у меня проблемы с получением совершенных результатов. Когда я использую библиотеку на идеальном скриншоте, он получает большую часть текста, и это нормально. Но когда я использую его на фото, например, у него есть проблемы с этим, а иногда он даже ничего не вернет.

Я знаю, что вы можете тренировать tesseract, есть ли хорошее учебное пособие или что-то для распознавания фотографий для iPhone? Или есть ли какие-либо модификации, которые я должен заставить мое исходное изображение перед обработкой его?

Спасибо!

Это было полезно?

Решение

Опубликовать образец Pic. Вот некоторые вещи, чтобы посмотреть:

Как вы получаете изображение на 1-битный? В конечном итоге OCR выполняется в B / W изображениях - возможно, вы можете сделать лучшую работу, чем библиотека.

Что такое DPI изображения? Scans обычно составляет около 200-300 др., Но фотографии могут быть 72 или 96. Двигатели OCR рассматривают DPI, чтобы получить смысл размера букв. Вам может потребоваться изменить DPI и отменить (изменить размер) изображение, так что DPI соответствует ожиданиям. Двигатели OCR ожидают отсканированные документы, а не фотографии.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top