Какое программное обеспечение вы бы порекомендовали для улучшения изображения перед OCR (оптическим распознаванием символов)?[закрыто]

StackOverflow https://stackoverflow.com/questions/142743

Вопрос

В настоящее время мы изучаем способы повышения качества изображения перед отправкой в OCR.Механизм распознавания, который мы в настоящее время используем, - это Scansoft API от Nuance (версия 15).Мы исследовали Свинцовые Инструменты но с тех пор решили поискать в другом месте.Затраты на лицензирование, связанные с ведущими инструментами, просто слишком велики.Для начала мы ищем простые функции улучшения изображения, такие как:шлифовка, удаление пятен, удаление линий, удаление отверстий под перфоратор, заточка и т.д.Мы используем сочетание программного обеспечения .NET и Java, но предпочтительнее было бы решение Java.

Это было полезно?

Решение

Kofax хорош для предварительной обработки, но для тех видов очистки, о которых вы говорите, может быть излишеством, если изображения действительно плохие.Если вы не специализируетесь на обработке изображений, я бы рекомендовал работать с поставщиком, который выполняет очистку изображений и распознавание текста, чтобы вы могли сосредоточиться на ценности, которую вы фактически добавляете.

Мы лицензируем набор для разработки OCR от ABBYY (ЭББИ SDK) и обнаружили, что он превосходен как для обработки изображений, так и для распознавания текста.API довольно обширный, а примеры приложений, справки и поддержки были более чем впечатляющими.Я определенно рекомендую взглянуть.

Другие советы

Отказ от ответственности:Я работаю в Atalasoft

У нас есть эти функции и бесплатное лицензирование во время выполнения для .NET.

http://www.atalasoft.com/products/dotimage/

У нас также есть компоненты распознавания текста, включая .NET-оболочку для Abbyy, Tesseract и других, и генерацию PDF-файлов с возможностью поиска (изображение поверх текста в PDF).

Не уверен, что это будет соответствовать стандартам, которые вам, ребята, понадобятся, но, возможно, вам стоит взглянуть на некоторые из Paint.Net АПИс.Я не знаю, насколько легко было бы извлечь их алгоритмы обработки изображений для использования в вашем проекте, но я верю, что они делают некоторые из тех вещей, которые вы ищете.Кроме того, это проект с открытым исходным кодом и лицензией MIT, так что он должен быть довольно удобным для использования в бизнесе.

Исследование о KOFAX VRS в KOFAX.com

Возможно, JMagick, это Java-интерфейс ImageMagick с открытым исходным кодом.Он реализован в виде тонкого слоя Java Native Interface (JNI) в ImageMagick API.Он лицензирован по LGPL, так что с точки зрения лицензии проблем возникнуть не должно.

http://sourceforge.net/projects/jmagick/

Я бы предложил Intel за его лицензирование с нулевыми затратами на выполнение.

Зависит от количества и качества исходных изображений.Управляемый код и наборы инструментов для создания изображений будут работать, но это не всегда лучшее решение, если вам нужно обработать несколько миллионов изображений.Для небольших партий и ограниченного бюджета я согласен с предыдущими плакатами о том, что проекты, подобные Эйфордж, Paint.NET, и другие библиотеки компьютерного зрения с открытым исходным кодом сделают свое дело.Конечно, вы сами по себе, если результаты не улучшаются...По крайней мере, это позволяет вам разместить все, что вам нужно, в одном приложении по низкой цене.

Если вы обрабатываете несколько сотен тысяч изображений в месяц, то я бы посоветовал вам разделить процесс на более мелкие этапы и настраивать каждый из них до тех пор, пока ваша стоимость за изображение не станет как можно ближе к нулю.Вы обнаружите, что результаты распознавания сначала растут быстро, а затем выравниваются быстрее, чем вы ожидали.(Я не большой поклонник распознавания текста, но оно имеет свое место)

Я использую коммерческий продукт Windows от Узнаваемая форма обрабатывать и очищать изображения перед распознаванием текста в пакетном режиме с использованием скриптов, адаптированных для различных типов изображений.Если изображение не проходит проверку качества или отклоняется механизмом распознавания текста, оно "восстанавливается" вручную с помощью специального приложения.СЕТЕВОЕ приложение, созданное с Atalasoft's инструментарий.Пакетно обрабатывайте все и прикасайтесь только к тому, что выходит из строя.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top