Domanda

Sto usando Tesseract per il mio progetto di riconoscimento di lettere e attualmente i riconoscimenti è abbastanza buona. La parte di elaborazione delle immagini è stato fatto utilizzando le librerie OpenCV. Le lettere sono mano written.But ci sono alcuni problemi quando ho usato per riconoscere la lettera "O" e il numero "0". Queste lettere sono utilizzati in aree di dati come i campi che entrano nomi. Così i nomi non possono avere qualsiasi numero con esso. E quando stiamo usando il sistema dei campi di dati come la data di nascita contiene solo numeri. Quindi sono disposto a dare la restrizione al sistema di riconoscimento dicendo che i corrispondenti campi di dati hanno solo numeri o le lettere.

E anche io sono disposto a rivedere le lettere riconosciuti con le parole possibili in modo da poter migliorare la precisione dei dati. Sono disposto a utilizzare le librerie OpenCV per questo compito. Ma io non so che cosa sono le librerie che l'aiuto per questo compito e quali sono le funzionalità di quelli. Quindi, per favore qualcuno può aiutarmi. Grazie.

Saluti, Thilanka.

È stato utile?

Soluzione

Non ho mai usato Tesseract. Tuttavia, nelle FAQ si dice

Come posso riconoscere solo cifre?

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

Presumibilmente si potrebbe utilizzare il modello della voce FAQ per impostarlo in modo che riconosce solo lettere o solo cifre in modo appropriato.

Se avete già provato questo, si può dare più dettagli del perché non funziona?

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top