rilevamento carattere veloce
-
22-08-2019 - |
Domanda
Non voglio sapere quello che dice, e non che fare con alcuna distorsione come un CAPTCHA, voglio solo sapere se un gruppo di immagini contengono alcun testo.
Questo è qualcosa che sarà in esecuzione su un paio di server Linux di inattività, e un job cron elaborerà una grande serie di immagini più volte al giorno.
Una delle cose che voglio fare nel processo, è scartare tutte le immagini con il testo in loro. Non mi importa dei falsi positivi, ma vorrei arrivare il più vicino a zero per cento non riuscire rate quando si tratta di identificare le immagini con il testo che dovrebbe essere scartato come possibile.
Soluzione
Il Tesseract OCR- è quello che utilizzano Google per Google Libri. Fare un tentativo.
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow