Onde posso começar a aprender sobre processamento de imagens e reconhecimento de objetos? [fechadas]

https://stackoverflow.com/questions/432569

10-07-2019
|

Pergunta

Estou interessado em escrever alguma aplicação básica reconhecimento de objetos computadorizada, então eu acho que eu preciso de alguma base teórica em algoritmos de processamento de imagem, juntamente com alguns AI para as capacidades de tomada de decisão.

Eu sou uma pós-graduação de ciência da computação, e um dia eu pretendo obter meu mestrado, espero que em um desses campos. Nesse meio tempo, eu gostaria de ter um ponto de partida e fazer alguma auto-aprendizagem.

Então, minha pergunta é, onde eu começo? Eu apreciaria uma flecha na direção certa, algumas ligações, se possível.

Solução

Você pode querer verificar para fora as respostas a estas pergunta semelhante:

/ ambiente

Outras dicas

Talvez dar uma olhada em: OpenCV . Realmente boa biblioteca para processamento de imagem, e quando você vai saber o que usar para o efeito, você pode dar uma olhada 'sob a capa' para saber como ele está trabalhando:)

Bem-vindo ao mundo da diversão de visão computacional, que é basicamente o campo que lidar com processamento de imagem com algoritmos de inteligência artificial para fazer reconhecimento / rastreamento / segmentação etc. Sem ser exaustivo, todo o negócio envolve a aquisição de imagem, processamento de imagem, segmentação de imagens , reconhecimento de imagem.

A maneira mais fácil de começar é provavelmente OpenCV. Na maioria das aplicações No entanto, usando OpenCV é provavelmente um exagero, já que não é realmente tão difícil começar do zero. Uma vez que você tenha passado o carregamento de imagens (Você provavelmente iria querer considerar BMP, pois é mais fácil de parse) parte, você pode implementar muitos algoritmos básicos de processamento de imagem, se você só tinha a fórmula matemática. Há também outra biblioteca você provavelmente poderia tentar, coisas assim torchvision, AForge (.NET) são boas escolhas.

Quando se trata da parte AI, aqui é onde as coisas se tornam interessantes. Você provavelmente iria querer usar SVM onde há uma série de biblioteca que você pode usar, por exemplo, LIBSVM, SVMlight e etc.

Se você está interessado em livros eu recomendo "Introdução ao processamento e análise de imagem", de John Russ a um nível introdutório. Eu também usei ImageJ como um bom, aplicação de análise de imagem livre - bom para prototipagem e tentar coisas fora. Como já foi dito a biblioteca OpenCV é bem vale a pena olhar também.

Eu escrevi alguns processamento de imagem OpenCV / tutoriais de visão de computador com código-fonte livre, de modo que você pode querer olhar para alguns deles para ajudar a obter um começo: http://www.shervinemami.co.cc/openCV.html

Boas respostas. Espero que você não é matemática-fóbica. Minha técnica favorita estes dias é Markov-Chain Monte Carlo (Google Spiegelhalter). O reconhecimento é um problema de otimização, e MCMC é uma forma geral de lidar com eles através Bayesiana de inferência.

Uma fonte aberta .NET SDK implementado em C # e C ++ foi recentemente lançado pela Microsoft com algum webcam em muito rudimentar interface e análise de imagem. Pode valer a pena tomar um browse em torno do código extremamente bem documentado apenas para obter indo com.

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow