Fraktur reconhecimento com OCRopus / Tesseract no Linux
Pergunta
Eu estou tentando executar o reconhecimento de um texto em alemão com fonte fraktur com OCRopus mas não parece estar usando pacote deu-f.
Aqui estão os passos que eu realizadas.
- compilado e instalado tesseract e OCRopus.
- http: // tesseract-ocr. googlecode.com/files/tesseract-2.01.deu-f.tar.gz , descompactado para tessdata /.
Mas quando eu chamo
$ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png
os resultados são os mesmos que quando eu chamo
$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png
Todas as idéias que o problema é?
Solução
O problema é descrito em http://code.google. com / p / OCRopus / questões / detalhes? id = 87 . Só precisa aplicar o patch para OCRopus e reconstruí-lo.
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow