riconoscimento Fraktur con OCRopus / Tesseract su Linux
Domanda
Sto cercando di eseguire il riconoscimento di un testo tedesco con fraktur carattere con OCRopus, ma non sembra essere utilizzando il pacchetto deu-f.
Ecco i passi che ho eseguito.
- Compilato e Tesseract e OCRopus installato.
- http: // tesseract-OCR. googlecode.com/files/tesseract-2.01.deu-f.tar.gz , scompattato a tessdata /.
Ma quando chiamo
$ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png
i risultati sono gli stessi di quando chiamo
$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png
Tutte le idee che è il problema?
Soluzione
Il problema è descritto in http://code.google. com / p / OCRopus / temi / dettaglio? id = 87 . Solo bisogno di applicare la patch al OCRopus e ricostruirlo.
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow