Извлечение и анализ конкретной информации о макете с двигателя OCR

https://stackoverflow.com/questions/8367641

27-10-2019
|

Вопрос

Я пытаюсь проанализировать информацию о макете с двигателей OCR с PHP, за исключением того, что они не дают никаких подробностей.

У меня есть и Tesseract (с лептоникой), так и Cuneiform. Предположительно, Cuneiform отлично подходит для обнаружения макета (то есть что такое текст, что такое картинка и т. Д.) Ввод - это файлы PNG с текстом и изображениями (очевидно, текст является частью изображения.)

Все они, кажется, думают, что я хочу, чтобы вывод был как TXT, HTML или HOCR ... когда я хочу, чтобы координаты того, что он считает текстом, и что он считает изображением.

Cuneiform имеет «нативную» опцию вывода, которая является форматом Cuneiform 2000, открывая его в блокноте ++ Я вижу, что он сжат. Я попытался извлечь его с помощью Zip и Gzip, но не узнает его. Никакой информации о Google о нативном формате Cuneiform также.

Кто -нибудь понял, как извлечь информацию о макете из Tesseract или Cuneiform ... или получил какие -либо лучшие идеи, чтобы выяснить макет изображения, содержащего текстовые блоки и изображения?

Решение

Посмотри на Эбби Файнер -Двигатель. Анкет Он имеет очень умный API, который предоставляет максимальную информацию о реггнированном тексту, включая его координаты. Это не бесплатно, но когда дело доходит до бизнес -программного обеспечения - Abbyy OCR Technologies может привести к серьезной ценности вашему продукту.

Поскольку вы работаете над веб -приложением в PHP, вы можете использовать веб -API Abbyy Engine Engine AT AT www.ocrosdk.com. Анкет Сейчас он находится в закрытой бета -версии, так что сейчас это бесплатно.

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow