Расположение текста внутри изображения

https://stackoverflow.com/questions/1848

08-06-2019
|

Вопрос

В настоящее время я работаю над проектом, и моя цель - найти текст на изображении.Распознавание текста пока не входит в мои намерения.Я хочу в основном получить границы текста внутри изображения.Я использую AForge.Компонент Net imaging для манипуляций.Какая-нибудь помощь в том или ином смысле?

Обновление 2/5/09:С тех пор я пошел по другому пути в своем проекте.Однако я попытался получить текст с помощью MODI (Microsoft Office Document Imaging).Это позволяет вам с некоторой легкостью распознавать изображение и извлекать из него текст.

Решение

Это активная область исследований.Существует буквально уйма научных работ на эту тему.Будет трудно оказать вам помощь, особенно без новых жертв.Вы ищете определенные типы текста?Шрифты?Только на английском?Знакомы ли вы с научной литературой?

"Обнаружение текста" является стандартной проблемой в любой системе OCR (оптического распознавания символов), и, следовательно, в веб-интерфейсах есть много фрагментов кода, которые с этим справляются.

Я мог бы начать перечислять груды ссылок из Google, но я предлагаю вам просто выполнить поиск по "распознаванию текста" и начать читать :).Также доступно достаточно примеров кода.

Другие советы

распознавание текста внутри изображения действительно является актуальной темой для исследователей в этой области, но она начала выходить из-под контроля только тогда, когда капча стало "нормой" с точки зрения защиты от спам-ботов.Зачем использовать captcha в качестве защиты?ну, потому что очень сложно найти (и прочитать) текст внутри изображения!

Причина, по которой я упоминаю captcha, заключается в том, что наибольшее продвижение * достигается в этой крошечной области, и я думаю, что ваше решение лучше всего найти там.особенно потому, что captcha действительно предназначены для размещения текста (или чего-то похожего на текст) внутри загроможденного изображения и последующей попытки правильно прочитать буквы.

так что, если ты сможешь найти себя хороший инструмент для взлома капчи с открытым исходным кодом вероятно, у вас есть все, что вам нужно, чтобы продолжить свои поиски...
Вероятно, вы могли бы даже выбросить самый сложный код, который обрабатывает само распознавание символов, потому что эти OCR используются для чтения искаженного текста, чего вам не нужно делать.

*:продвижение с точки зрения видимого, полезного и практичный информация для "неисследователя"

Если вы согласны использовать онлайн-API для этого, API по адресу http://www.wisetrend.com/wisetrend_ocr_cloud.shtml может выполнять распознавание текста в дополнение к простому распознаванию текста.

Преобразование ширины штриха могу сделать это за вас.Это, по крайней мере, то, что MS разработала для своей операционной системы для мобильных телефонов.Обсуждение вопроса о реализации является здесь, в https://stackoverflow.com/

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow