7-сегмент дисплей OCR

https://stackoverflow.com/questions/9361213

28-10-2019
|

Вопрос

Я строю приложение для iOS (сфотографируйте и запускаю OCR), используя Tesseract (библиотека OCR), и оно очень хорошо работает с хорошо написанными числами и символами (с использованием обычных шрифтов).

Проблема, с которой я сталкиваюсь, заключается в том, что если я попробую на 7-сегментном дисплее, это дает очень очень плохие результаты.

Итак, мой вопрос: кто -нибудь знает, как я могу подойти к этой проблеме? Есть ли способ для Tesseract распознавать этих персонажей?

Решение

У меня тоже были большие трудности с получением Tesseract, чтобы распознать цифры из изображений ЖК -дисплеев.

Я имел некоторый незначительный успех, предварительно обрабатывая изображения с ImageMagick, чтобы наложить копию изображения на себя с небольшим вертикальным сдвигом, чтобы заполнить пробелы между сегментами:

$ composite -compose Multiply -geometry +0+3  foo.tif foo.tif foo2.png

В конце концов, однако, моей спасительной грацией была "Семь сегментов оптическое распознавание символов"Бинарный: http://www.unix-ag.uni-kl.de/~auerswal/ssocr/

Большое спасибо автору, Эрику Ауэрсальду, за этот код!

Другие советы

Я не пробовал OCRING 7-сегментный дисплей, но я подозреваю, что проблема может быть вызвана тем, что символы не подключаются к компонентам. Tesseract не справляется с отключенными шрифтами от моего опыта.

Простая эрозия (предварительная обработка изображения) может помочь, подключив сегменты, но вам придется проверить ее и играть с размером ядра, чтобы предотвратить слишком большое искажение.

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow