Pergunta

Eu procurei em busca de código aberto OCR para chinês. Mas sem sorte, raramente parece haver algum OCR de código aberto (para chinês) que são utilizáveis.

Então, estou aqui me perguntando:

  1. Existe algum OCR de código aberto para chinês que possa ser usado para o ambiente de produção?

  2. Quais são as principais diferenças ao implementar um OCR para as idiomas latinos e para os chineses? Conheço um bom OCR, como Tesseract ou Ocropus, o que devo fazer se quiser fazê -lo apoiar chinês?

Qualquer ajuda é apreciada e obrigado antecipadamente ~

Foi útil?

Solução

Você pode escolher:

  • TESSERACT 3.0 Apoio chinês/japonês
  • O NHOCIN apoia japonês

Outras dicas

Os chineses têm muito mais caracteres do que as línguas latinas. Existem alguns produtos comerciais. Uma das maneiras é entrar em contato com eles e obter ajuda.

Eu não acho que exista um código aberto para personagens chineses ou japoneses. Na área do OCR, existem muitas técnicas além dos algoritmos de reconhecimento de padrões, onde uma empresa é boa, não a comunidade de código aberto.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top