Domanda

Sto cercando una spiegazione doc / API / esempi di come l'uso (e treno?) Tesseract in C ++, niente di utile sulla pagina di Google Tesseract, e ancora trovare qualcosa sul web.

Chiunque fonti utili, esperienze sarebbe più che benvenuto, come non ho idea di come iniziare con esso.

P.S:

  1. Sono aperto per i suggerimenti su altri librerie.
  2. Solo GRATIS le librerie
È stato utile?

Soluzione

Ho una certa esperienza con Tesseract ... un semplice google di 'tesseract formazione' rivela questa pagina: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract dove si deve scegliere quale versione di tesseract si desidera treno .. Mentre il 3 è l'ultima versione, è nuovo di zecca e, quindi, le persone sono ancora aggiustando eventuali problemi - im ancora utilizzando la versione 2.4. In ogni modo, vedrete ci sono circa 9 passi nella tesseract formazione per un particolare 'linguaggio' (o quello che avrebbe dovuto essere chiamato 'font' o 'set di caratteri che'). Si potrebbe anche solo utilizzare il 'ita' lingua esistente - ma dipende dalla vostra applicazione. Per esempio, nella mia applicazione avrei dovuto fare l'analisi del documento e prendere una particolare regione e vogliono OCR una stringa di 13 caratteri di numeri - e avevo bisogno di un'alta precisione - e non volevo che la lettura di '5' come ' S 'e '0', come 'O', ecc, quindi era logico per creare una particolare 'linguaggio' della mia particolare font-set composto solo dei personaggi 0..9, mentre si potrebbe non importa se si ottiene in più' di rumore

Altri suggerimenti

Tesseract OCR è una libreria open source per il rilevamento ottico dei caratteri. Hai solo bisogno di includere i file di libreria se si utilizza Visual Studio. Se si utilizza Qt Creator, allora devi costruire la biblioteca per il lavoro sul QT. È necessario utilizzare CMakelist o cmake Gui per costruire la biblioteca. È possibile visitare il link costruzione Opencv Ocr per Qt 5.4 mingw

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top