7-сегмент дисплей OCR
-
28-10-2019 - |
Вопрос
Я строю приложение для iOS (сфотографируйте и запускаю OCR), используя Tesseract (библиотека OCR), и оно очень хорошо работает с хорошо написанными числами и символами (с использованием обычных шрифтов).
Проблема, с которой я сталкиваюсь, заключается в том, что если я попробую на 7-сегментном дисплее, это дает очень очень плохие результаты.
Итак, мой вопрос: кто -нибудь знает, как я могу подойти к этой проблеме? Есть ли способ для Tesseract распознавать этих персонажей?
Решение
У меня тоже были большие трудности с получением Tesseract, чтобы распознать цифры из изображений ЖК -дисплеев.
Я имел некоторый незначительный успех, предварительно обрабатывая изображения с ImageMagick, чтобы наложить копию изображения на себя с небольшим вертикальным сдвигом, чтобы заполнить пробелы между сегментами:
$ composite -compose Multiply -geometry +0+3 foo.tif foo.tif foo2.png
В конце концов, однако, моей спасительной грацией была "Семь сегментов оптическое распознавание символов"Бинарный: http://www.unix-ag.uni-kl.de/~auerswal/ssocr/
Большое спасибо автору, Эрику Ауэрсальду, за этот код!
Другие советы
Я не пробовал OCRING 7-сегментный дисплей, но я подозреваю, что проблема может быть вызвана тем, что символы не подключаются к компонентам. Tesseract не справляется с отключенными шрифтами от моего опыта.
Простая эрозия (предварительная обработка изображения) может помочь, подключив сегменты, но вам придется проверить ее и играть с размером ядра, чтобы предотвратить слишком большое искажение.