Pergunta

Boa noite:)

Atualmente, estou jogando com a biblioteca diabo que me permite carregar na imagem e verificar valores RGB por pixel. Assim como um projeto de aprendizagem pessoal, eu estou tentando escrever um sistema de OCR muito básico para um par de imagens que eu me fiz em Photoshop.

Estou com sucesso capaz de remover todas as distorções na imagem e eu estou à esquerda com texto e números. Actualmente, eu não estou procurando uma rede neural avançado que aprenda a partir da entrada. Eu quero começar de forma relativamente fácil e para que eu tenha a intenção de identificar os caracteres individuais e contar os pixels na esses caracteres.

Eu tenho dois problemas:

  • A identificação dos caracteres individuais.
  • O mais importante: eu preciso de um algoritmo para contar pixels conectados (da mesma cor), sem pixels contagem contei anteriormente. Eu não tenho nenhum fundo mathemathical de modo que este é o maior problema para mim.

Qualquer ajuda na matéria é apreciada, obrigado.

edit:

Eu tenho marcado esta pergunta como C ++, porque isso é o que eu estou usando atualmente. No entanto, pseudo-código ou código de fácil leitura de uma outra língua também está bem.

Foi útil?

Solução

O inundação algoritmo de preenchimento irá trabalhar para contar os pixels incluídos, desde que você tem as imagens filtradas para baixo para bitmaps preto e branco simples.

Dito isto, você pode executar reconhecimento de caracteres, comparando cada personagem a um conjunto de imagens padrão de cada personagem em seu conjunto, medindo a semelhança, e depois escolher o personagem com a maior pontuação.

Dê uma olhada esta questão para mais informações.

Outras dicas

Não tenho certeza isso ajuda, mas há um lib GPL OCR chamado gocr .

Desculpas se isso está muito longe off-topic, mas IMHO Vigra (não a outra!) é a melhor biblioteca de muito processamento de imagem para C ++ que diabo.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top