Pergunta

Preciso de uma biblioteca que possa detectar objetos em uma imagem (usa detecção de borda). Isso não está relacionado a Captchas. Estou trabalhando em um bot MTGO que usa OCR e funciona em qualquer resolução da tela. Para que ele portas para qualquer resolução de tela, minha idéia é escanear o alcance estreito em uma página de resultados (os cartões que um jogador possui podem ser listados em linhas de texto) e encontrar cada objeto nesse intervalo. Em seguida, para pegar as coordenadas de pixels mais baixas e mais altas de cada objeto para descobrir onde a linha inicia e termina (no eixo y) para que eu possa usar OCR para ler cada linha.

Foi útil?

Solução

Se você não conhece o OpenCV coleção de exemplos, eles poderiam ajudá -lo na direção certa ... também há Camélia O que não usa "detecção de borda" por se, mas pode obter os resultados necessários com um pouco de trabalho.

Outras dicas

Não é barato, mas usei as primitivas de processamento da Intel e fiquei muito impressionado com o desempenho deles. Eles trabalham nos processadores Intel e AMD, bem como Windows e Linux

Talvez isso seja útil:

o Biblioteca Simd é uma biblioteca gratuita de processamento de imagem de código aberto, projetado para programadores C e C ++. Ele fornece muitos algoritmos úteis de alto desempenho para processamento de imagens, como: conversão de formato de pixel, escala e filtração de imagens, extração de informações estatísticas de imagens, detecção de movimento. Os algoritmos são otimizados com o uso de diferentes extensões SIMD CPU. Em particular, a biblioteca suporta as seguintes extensões da CPU: SSE, SSE2, SSSE3, SSE4.1, SSE4.2, AVX e AVX2 para X86/X64, VMX (Altivec) e VSX (Power7) para PowerPC, neon para braço. A biblioteca SIMD possui API C e também contém classes e funções úteis de C ++ para facilitar o acesso à API C. A biblioteca suporta vinculação dinâmica e estática, compiladores de Windows e Linux, MSVs e G ++ de 32 e 64 bits, projetos MSVs e sistemas de construção cmake.

Tenha olhado para o SDKs de imagem para ferramentas principais? Não é livre, mas muito abrangente.

Tesseract-ococ ? (Licença Apache 2.0)

Onda de quadro com base em Biblioteca de desempenho da AMD que fornece recursos para o processamento de imagens. Verifique também relacionado Bibliotecas rápidas de processamento de imagem C/C ++ de plataforma cruzada

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top