Pregunta

Estoy buscando una explicación doc / API / ejemplos de cómo el uso (y el tren?) Tesseract en C ++, nada útil en la página de Google Tesseract, y sin embargo, encontrar algo a través de Internet.

fuentes útiles a nadie, experiencias sería más que bienvenido, ya que no tengo idea de cómo empezar con ella.

P.S:

  1. Estoy abierto a sugerencias sobre otra bibliotecas.
  2. Sólo Fotos bibliotecas
¿Fue útil?

Solución

Tengo alguna experiencia con Tesseract ... un simple Google de 'entrenamiento Tesseract' revela esta página: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract en el que debe elegir qué versión de Tesseract desea tren .. Mientras que 3 es la última versión, es nuevo y por lo tanto la gente sigue limar cualquier problema - todavía estoy usando la versión 2.4. De todas formas, verá que hay cerca de 9 pasos en la formación de Tesseract un 'lenguaje' en particular (o lo que debería haber sido llamado 'fuentes' o 'carácter conjuntos'). También puede simplemente usar el lenguaje 'eng' existente - pero depende de su aplicación. Por ejemplo, en mi aplicación que tendría que hacer el análisis de documentos y tomar una región en particular y desea OCR de una cadena de 13 caracteres de números - y necesitaba una gran precisión - y yo no quería que la lectura de '5' como ' S 'y '0' como 'O', etc, por lo que era lógico para crear un especial 'lenguaje' de mi en particular font-conjunto que consta únicamente de los caracteres 0..9, mientras que es posible que no importa si usted consigue extra' ruido

Otros consejos

Tesseract OCR es una biblioteca de código abierto para la detección óptico de caracteres. Sólo tiene que incluir los archivos de la biblioteca si está utilizando Visual Studio. Si está utilizando Qt Creator entonces usted tiene que construir la biblioteca para trabajar en el intervalo QT. Es necesario utilizar CMakelist o Cmake Gui para construir la biblioteca. Se puede visitar el enlace Reconocimiento de caracteres OPENCV acumulación de Qt 5.4 MinGW

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top