O software que você recomendaria para aprimoramento de imagem antes de OCR (Optical Character Recognition)? [fechadas]

https://stackoverflow.com/questions/142743

02-07-2019
|

Pergunta

Estamos atualmente pesquisando formas de melhorar a qualidade de imagem antes da apresentação para OCR. O motor de OCR atualmente estamos utilizando é a API Scansoft da Nuance (v15). Estávamos pesquisando os Ferramentas de chumbo mas, desde então, decidiu procurar em outro lugar. Os custos de licenciamento associados com ferramentas de chumbo é muito grande. Para começar, estamos à procura de melhoria de imagem simples caracteriza tais como: deskewing, despeckling, remoção de linha, a remoção de perfuração, nitidez, etc. Estamos executando uma mistura de .NET e Java software, mas solução java seria preferível

Solução

Kofax é bom para pré-processamento, mas para os tipos de limpeza que você está falando pode ser um exagero, a menos que as imagens são realmente ruins. A menos que sua especialidade é no processamento de imagem, eu recomendo trabalhar com um fornecedor que faz a limpeza de imagem e OCR para que você possa se concentrar no valor que você realmente adicionar.

Nós licenciar o kit de desenvolvimento de OCR da ABBYY ( ABBY SDK ) e tê-lo encontrado para ser excelente para o processamento de imagem e OCR. A API é bastante extensa, ea aplicativos de amostra, ajuda e apoio foram além impressionante. Eu definitivamente recomendo dar uma olhada.

Outras dicas

Disclaimer: trabalho eu para Atalasoft

Temos essas funções e de tempo de execução licenciamento royalty-free for .NET.

http://www.atalasoft.com/products/dotimage/

Temos também componentes OCR incluindo um .NET wrapper para Abbyy, Tesseract e outros e pesquisável geração PDF (imagem em cima do texto de um PDF)

Não sei se isso seria bastante até os padrões que vocês seria necessário, mas talvez você deve olhar para alguns dos Paint.Net APIs. Eu não sei como seria fácil para extrair os seus algoritmos de processamento de imagem para uso em seu projeto, mas eu acredito que eles fazer algumas das coisas que você está procurando. Além disso, é um projeto open source com uma licença MIT, por isso deve ser muito amigável para uso comercial.

A investigação sobre o Kofax VRS em KOFAX.com

Talvez JMagick, é uma fonte aberta interface Java do ImageMagick. Ele é implementado na forma de uma fina camada Java Native Interface (JNI) para a API ImageMagick. É licenciado sob a LGPL por isso não deve ser uma licença problema sábio.

http://sourceforge.net/projects/jmagick/

Eu sugeriria Intel para seu licenciamento runtime custo zero.

Depende do número e da qualidade das imagens originais. kits de código e ferramentas de imagem gerenciados vai funcionar, mas nem sempre é a melhor solução se você haved vários milhões de imagens de processo. Para pequenos lotes e orçamentos apertados, eu concordo com os cartazes anteriores que projetos como Aforge, Paint.NET , e outras bibliotecas de visão por computador de código aberto irá fazer o truque. Claro, você está no seu próprio país, se os resultados não estão melhorando ... Pelo menos vamos você colocar tudo que você precisa sob uma aplicação para um baixo custo.

Se você estiver processando centenas de milhares de imagens por mês, então eu sugiro que você dividir o processo em etapa de fluxo de trabalho menor e ajustar cada um até que seu custo por imagem fica mais próximo de zero possível. Você vai descobrir que os resultados de OCR subir rapidamente no início e depois nivelar mais cedo do que o esperado. (Eu não sou um grande fã de OCR mas tem seu lugar)

Eu uso o produto comercial Windows a partir de Recogniform para processo e limpar as imagens antes de OCR em um modo em lote usando scripts ajustados para vários tipos de imagens. Se uma imagem não QC ou é rejeitado pelo motor de OCR, é "reparado" à mão usando um aplicativo personalizado .NET construído com kit de ferramentas de Atalasoft. tudo o processo em lote e apenas toque o que falha.

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow