Localizar texto dentro de la imagen

https://stackoverflow.com/questions/1848

08-06-2019
|

Pregunta

Actualmente estoy trabajando en un proyecto y mi objetivo es localizar texto en una imagen.Hacer OCR del texto no es mi intención hasta el momento.Básicamente quiero obtener los límites del texto dentro de una imagen.Estoy usando el componente de imágenes AForge.Net para la manipulación.¿Alguna ayuda en algún sentido u otro?

Actualización 5/02/09:Desde entonces, seguí otra ruta en mi proyecto.Sin embargo, intenté obtener texto usando MODI (Microsoft Office Document Imaging).Le permite realizar OCR de una imagen y extraer texto de ella con cierta facilidad.

Solución

Esta es un área activa de investigación.Hay literalmente montones de artículos académicos sobre el tema.Va a ser difícil brindarle asistencia, especialmente sin más detalles.¿Estás buscando tipos específicos de texto?¿Fuentes?¿Solo inglés?¿Está familiarizado con la literatura académica?

La "detección de texto" es un problema estándar en cualquier sistema OCR (reconocimiento óptico de caracteres) y, en consecuencia, hay muchos fragmentos de código en Internet que se ocupan de ello.

Podría empezar a enumerar montones de enlaces de Google, pero te sugiero que hagas una búsqueda de "detección de texto" y empieces a leer :).También hay un amplio código de ejemplo disponible.

Otros consejos

Reconocer texto dentro de una imagen es de hecho un tema candente para los investigadores en ese campo, pero solo comenzó a salirse de control cuando captchas se convirtió en la "norma" en términos de defensa contra los robots de spam.¿Por qué utilizar captcha como protección?bueno, ¡porque es/era muy difícil localizar (y leer) texto dentro de una imagen!

La razón por la que menciono los captcha es porque el mayor avance* se realiza dentro de esa pequeña área, y creo que la solución se podría encontrar mejor allí.especialmente porque los captcha consisten en ubicar texto (o algo que se parezca a texto) dentro de una imagen desordenada y luego intentar leer las letras correctamente.

entonces si puedes encontrarte a ti mismo una buena herramienta de código abierto para romper captcha probablemente tengas todo lo que necesitas para continuar tu búsqueda...
Probablemente incluso podrías desechar el código más difícil que maneja el reconocimiento de caracteres en sí, porque esos OCR se usan para leer texto distorsionado, algo que no tienes que hacer.

*:avance en términos de visibilidad, utilización y práctico información para un "no investigador"

Si está de acuerdo con usar una API en línea para esto, la API en http://www.wisetrend.com/wisetrend_ocr_cloud.shtml Puede realizar detección de texto además de solo OCR.

Transformación de ancho de trazo puedo hacer eso por ti.Eso es al menos lo que MS desarrolló para el sistema operativo de su teléfono móvil.Una discusión sobre la implementación es aquí en https://stackoverflow.com/

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow