Какую библиотеку Java OCR мне следует использовать в Android?[закрыто]

StackOverflow https://stackoverflow.com/questions/1062578

  •  21-08-2019
  •  | 
  •  

Вопрос

Я хотел бы создать Android-приложение, которое через библиотеку OCR должно сканировать изображение, извлекая из него текст.

Какую библиотеку Java мне следует использовать?

Это было полезно?

Решение

Не знаю, насколько это хорошо (его точно нужно сначала обучить), но есть Java-библиотека OCR Рона Семера.

Другие советы

Если вы ищете очень расширяемый вариант или у вас есть конкретная проблемная область, вы можете рассмотреть возможность создания собственной, используя Java-объектно-ориентированный нейронный движок.

Я успешно использовал его в личном проекте, чтобы идентифицировать букву по изображению, например этот, вы можете найти весь исходный код компонента OCR моего приложения на github, здесь.

Попробуйте Tesseract, проверьте эту статьюhttp://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.htmlи этот примерhttp://code.google.com/p/mezzofanti/

Редактировать:Еще несколько фактов - Tesseract - один из лучших OCR с открытым исходным кодом, используемый Google - есть учебные данные, доступные для многих языков - Mezzofanti - это приложение для Android, которое использует Tesseract - остерегайтесь:OCR использует много мощности процессора.попытка распознать страницу формата А4 с помощью T-Mob G1 займет много времени, и результат может вас не впечатлить ;-)

Вы можете использовать функцию OCR из Документов Google.Проверить API данных списка документов http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#OCR

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top