détection de caractère rapide
-
22-08-2019 - |
Question
Je ne veux pas savoir ce qu'il dit, et il ne sera pas traiter toute distorsion comme un CAPTCHA, je veux juste savoir si groupe d'images contiennent tout texte.
Ceci est quelque chose qui va être en cours d'exécution sur deux serveurs Linux inactifs, et une tâche cron traitera un grand lot d'images plusieurs fois par jour.
L'une des choses que je veux faire dans le processus, est Otez toutes les images avec le texte en eux. Je ne me dérange pas des faux positifs, mais je voudrais me rapprocher d'un taux d'échec de zéro pour cent en ce qui concerne l'identification des images avec le texte qui devrait être mis au rebut possible.
La solution
Le Tesseract-OCR est ce utiliser Google pour Google Livres. Lui donner un essai.