Domanda

Sto usando Tesseract in una delle mie applicazioni, e sto avendo difficoltà a ottenere risultati perfetti. Quando uso la libreria su un perfetto screenshot, si ottiene la maggior parte del testo e va bene. Ma quando lo uso su una foto, ad esempio, ha problemi a lavorare fuori, e qualche volta non sarà nemmeno restituire nulla.

So che si può allenare Tesseract, c'è un tutorial di formazione bene o qualcosa per iPhone il riconoscimento foto? Oppure ci sono eventuali modifiche devo apportare alla mia immagine di origine prima di elaborarlo?

Grazie!

È stato utile?

Soluzione

Inserisci una foto del campione. Qui ci sono alcune cose da guardare:

Come va l'immagine da 1-bit? In ultima analisi OCR è fatto in B / W immagini - forse si può fare un lavoro migliore di quello della biblioteca.

Qual è il DPI dell'immagine? Le scansioni di solito sono circa 200-300 DPI, ma le foto possono essere 72 o 96. OCR motori guardano DPI per avere un'idea della dimensione delle lettere. Potrebbe essere necessario cambiare il DPI e resample (resize) l'immagine in modo che il DPI soddisfa le aspettative. motori OCR si aspettano i documenti acquisiti, non fotografie.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top