Formazione Tesseract su iPhone

https://stackoverflow.com/questions/3843798

27-09-2019
|

Domanda

Sto usando Tesseract in una delle mie applicazioni, e sto avendo difficoltà a ottenere risultati perfetti. Quando uso la libreria su un perfetto screenshot, si ottiene la maggior parte del testo e va bene. Ma quando lo uso su una foto, ad esempio, ha problemi a lavorare fuori, e qualche volta non sarà nemmeno restituire nulla.

So che si può allenare Tesseract, c'è un tutorial di formazione bene o qualcosa per iPhone il riconoscimento foto? Oppure ci sono eventuali modifiche devo apportare alla mia immagine di origine prima di elaborarlo?

Grazie!

Soluzione

Inserisci una foto del campione. Qui ci sono alcune cose da guardare:

Come va l'immagine da 1-bit? In ultima analisi OCR è fatto in B / W immagini - forse si può fare un lavoro migliore di quello della biblioteca.

Qual è il DPI dell'immagine? Le scansioni di solito sono circa 200-300 DPI, ma le foto possono essere 72 o 96. OCR motori guardano DPI per avere un'idea della dimensione delle lettere. Potrebbe essere necessario cambiare il DPI e resample (resize) l'immagine in modo che il DPI soddisfa le aspettative. motori OCR si aspettano i documenti acquisiti, non fotografie.

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow