Лучший OCR для извлечения текста из сюжета? [закрыто]
Вопрос
(источник: goldprice.org )
Кто-нибудь знает хороший ocr, который способен конвертировать это изображение в текст? Я пробовал tesseract , но это не сработало так, как я ожидал. р>
Решение
Вы можете сначала попытаться найти текст " Цена на золото " или "GBP" (если этот текст всегда один и тот же) И тогда вы узнаете место, где находится этот текст, затем просто обрежьте ту часть изображения, содержащую текст, и перейдите к оптическому распознаванию этой строки отдельно. Вы также можете попробовать Cuneiform: текст ссылки
Другие советы
Похоже, что вам нужно Engauge Digitizer (с открытым исходным кодом) - программное обеспечение для оцифровки, которое преобразует файл изображения, отображающий график или карта, в числах.