Вопрос

Спокойной ночи :)

В настоящее время я играю с библиотекой DevIL, которая позволяет мне загружать изображение и проверять значения RGB для каждого пикселя.Просто в качестве личного учебного проекта я пытаюсь написать очень простую систему распознавания текста для пары изображений, которые я сделал сам в Photoshop.

Мне успешно удается удалить все искажения на изображении, и у меня остаются текст и цифры.В настоящее время я не ищу продвинутую нейронную сеть, которая обучается на основе входных данных.Я хочу начать относительно просто, и поэтому я решил идентифицировать отдельные символы и подсчитать количество пикселей в этих символах.

У меня есть две проблемы:

  • Идентификация отдельных персонажей.
  • Самое главное:Мне нужен алгоритм для подсчета связанных пикселей (одного цвета) без подсчета пикселей, которые я подсчитал ранее.У меня нет математического образования, так что это самая большая проблема для меня.

Любая помощь в этом вопросе ценится, спасибо.

Редактировать:

Я пометил этот вопрос как C ++, потому что это то, что я сейчас использую.Однако псевдокод или легко читаемый код с другого языка также подойдет.

Это было полезно?

Решение

Тот Самый заливка потоком алгоритм будет работать для подсчета включенных пикселей, если у вас есть изображения, отфильтрованные до простых черно-белых растровых изображений.

Сказав это, вы можете выполнить распознавание символов, сравнив каждого персонажа с набором стандартных изображений каждого персонажа в вашем наборе, измерив сходство, а затем выбрав персонажа, набравшего наибольшее количество баллов.

Взгляните на этот вопрос для получения дополнительной информации.

Другие советы

Не уверен, что это помогает, но есть GPL OCR Lib называется GOCR .

Прошу прощения, если это слишком далеко от темы, но ИМХО Вигра (не та, другая!) - это гораздо лучшая библиотека обработки изображений для C ++, чем DevIL.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top