Question

J'utilise Tesseract dans l'une de mes applications, et je vais avoir du mal à obtenir des résultats parfaits. Lorsque j'utilise la bibliothèque sur une capture d'écran parfait, il obtient la plupart du texte et que va bien. Mais quand je l'utilise sur une photo par exemple, il a du mal à travailler dehors, et parfois il ne reviendra pas même quoi que ce soit.

Je sais que vous pouvez former Tesseract, est-il un bon tutoriel de formation ou quelque chose pour la reconnaissance photo de l'iPhone? Ou sont-il des modifications que je dois faire à mon image source avant de le traiter?

Merci!

Était-ce utile?

La solution

Poster un pic de l'échantillon. Voici quelques choses à regarder:

Comment obtenez-vous l'image à 1 bit? En fin de compte OCR est fait dans les images B / W - vous pouvez peut-être faire un meilleur travail que la bibliothèque.

Quel est le DPI de l'image? Scans sont généralement autour de 200-300 DPI, mais les photos peuvent être 72 ou 96. OCR moteurs regardent DPI pour avoir une idée de la taille des lettres. Vous devrez peut-être changer le DPI et ré-échantillonnage (Resize) l'image de sorte que le DPI correspond aux attentes. Les moteurs OCR attendent des documents numérisés, pas de photos.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top