Pregunta

He buscado alrededor de OCR de código abierto para el chino. Pero sin ninguna suerte allí rara vez parece que hay algún código abierto OCR (para China) que están disponibles.

Así que estoy aquí preguntando:

  1. ¿Hay alguna fuente abierta OCR para el chino que podría ser utilizado para el entorno de producción?

  2. ¿Cuál es la principal diferencia en la aplicación de un programa de OCR para los latinos-idiomas y para los chinos? Sé un buen OCR Tesseract o como OCRopus, ¿qué debería hacer si quiero que sea el apoyo de China?

Cualquier ayuda es muy apreciada y gracias de antemano ~

¿Fue útil?

Solución

Se puede elegir:

  • Tesseract 3.0 apoyo chino / japonés
  • NHOCR japonés de apoyo

Otros consejos

China tiene ahora más caracteres que las lenguas latinas. Hay algunos productos comerciales. Una de las maneras de hacerlo es ponerse en contacto con ellos y obtener ayuda.

No creo que no es una fuente abierta para los caracteres chinos o japoneses. En el área de OCR, hay una gran cantidad de técnicas más allá de los algoritmos de reconocimiento de patrones, donde una empresa es bueno en, no a la comunidad de código abierto.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top