Domanda

Non voglio sapere quello che dice, e non che fare con alcuna distorsione come un CAPTCHA, voglio solo sapere se un gruppo di immagini contengono alcun testo.

Questo è qualcosa che sarà in esecuzione su un paio di server Linux di inattività, e un job cron elaborerà una grande serie di immagini più volte al giorno.

Una delle cose che voglio fare nel processo, è scartare tutte le immagini con il testo in loro. Non mi importa dei falsi positivi, ma vorrei arrivare il più vicino a zero per cento non riuscire rate quando si tratta di identificare le immagini con il testo che dovrebbe essere scartato come possibile.

È stato utile?

Soluzione

Il Tesseract OCR- è quello che utilizzano Google per Google Libri. Fare un tentativo.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top