Question

Je ne veux pas savoir ce qu'il dit, et il ne sera pas traiter toute distorsion comme un CAPTCHA, je veux juste savoir si groupe d'images contiennent tout texte.

Ceci est quelque chose qui va être en cours d'exécution sur deux serveurs Linux inactifs, et une tâche cron traitera un grand lot d'images plusieurs fois par jour.

L'une des choses que je veux faire dans le processus, est Otez toutes les images avec le texte en eux. Je ne me dérange pas des faux positifs, mais je voudrais me rapprocher d'un taux d'échec de zéro pour cent en ce qui concerne l'identification des images avec le texte qui devrait être mis au rebut possible.

Était-ce utile?

La solution

Le Tesseract-OCR est ce utiliser Google pour Google Livres. Lui donner un essai.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top