Localisation du texte dans l'image

https://stackoverflow.com/questions/1848

08-06-2019
|

Question

Je travaille actuellement sur un projet et mon objectif est de localiser du texte dans une image.L'OCR du texte n'est pas encore mon intention.Je veux essentiellement obtenir les limites du texte dans une image.J'utilise le composant d'imagerie AForge.Net pour la manipulation.Une aide dans un sens ou dans un autre ?

Mise à jour du 5/02/09 :Depuis, j'ai emprunté une autre voie dans mon projet.Cependant, j'ai tenté d'obtenir du texte en utilisant MODI (Microsoft Office Document Imaging).Il vous permet d'OCR une image et d'en extraire du texte avec une certaine facilité.

La solution

Il s’agit d’un domaine de recherche actif.Il existe littéralement une multitude d’articles universitaires sur le sujet.Il va être difficile de vous aider, surtout sans plus de détails.Recherchez-vous des types de texte spécifiques ?Des polices ?Que l'anglais?Connaissez-vous la littérature académique ?

La "détection de texte" est un problème standard dans tout système OCR (reconnaissance optique de caractères) et par conséquent il existe de nombreux bits de code sur les interwebs qui le traitent.

Je pourrais commencer à lister des tas de liens provenant de Google mais je vous suggère de simplement faire une recherche sur "détection de texte" et de commencer à lire :).De nombreux exemples de code sont également disponibles.

Autres conseils

reconnaître du texte à l'intérieur d'une image est en effet un sujet brûlant pour les chercheurs dans ce domaine, mais il n'a commencé à devenir incontrôlable que lorsque captcha est devenu la « norme » en termes de défense contre les robots spammeurs.Pourquoi utiliser les captcha comme protection ?et bien parce qu'il est/était très difficile de localiser (et de lire) du texte à l'intérieur d'une image !

La raison pour laquelle je mentionne les captcha est que le plus de progrès* se fait dans cette petite zone, et je pense que votre solution pourrait être mieux trouvée là-bas.surtout parce que les captcha consistent en effet à localiser du texte (ou quelque chose qui ressemble à du texte) à l'intérieur d'une image encombrée et ensuite à essayer de lire correctement les lettres.

donc si tu peux te trouver un bon outil open source pour briser le captcha vous avez probablement tout ce dont vous avez besoin pour continuer votre quête...
Vous pourriez probablement même jeter le code le plus difficile qui gère la reconnaissance des caractères lui-même, car ces OCR sont utilisés pour lire du texte déformé, ce que vous n'êtes pas obligé de faire.

* :progrès en termes de visible, utilisable et pratique information pour un "non-chercheur"

Si vous êtes d'accord avec l'utilisation d'une API en ligne pour cela, l'API sur http://www.wisetrend.com/wisetrend_ocr_cloud.shtml peut effectuer une détection de texte en plus de la simple OCR.

Transformation de la largeur du trait peut le faire pour vous.C'est du moins ce que MS a développé pour son système d'exploitation de téléphone mobile.Une discussion sur la mise en œuvre est ici sur https://stackoverflow.com/

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow