Pergunta

Estou usando o Tesseract em um dos meus aplicativos e estou tendo problemas para obter resultados perfeitos. Quando uso a biblioteca em uma captura de tela perfeita, ela recebe a maior parte do texto e tudo bem. Mas quando eu o uso em uma foto, por exemplo, ela tem problemas para resolver e, às vezes, nem mesmo retorna nada.

Eu sei que você pode treinar Tesseract, existe um bom tutorial de treinamento ou algo para o reconhecimento de fotos para iPhone? Ou existem modificações que devo fazer na minha imagem de origem antes de processá -la?

Obrigado!

Foi útil?

Solução

Publique uma amostra. Aqui estão algumas coisas para olhar:

Como você está colocando a imagem para 1 bit? Por fim, o OCR é feito em imagens B/W - talvez você possa fazer um trabalho melhor que a biblioteca.

Qual é o DPI da imagem? As varreduras geralmente têm cerca de 200 a 300 dpi, mas as fotos podem ter 72 ou 96 anos. Os motores OCR olham para o DPI para ter uma noção do tamanho das letras. Você pode precisar alterar o DPI e resampar (redimensionar) a imagem para que o DPI corresponda às expectativas. Os motores OCR esperam documentos digitalizados, não fotografias.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top