como é que o agrupamento de dados ajuda na imagem ou reconhecimento de padrões

https://stackoverflow.com/questions/1436260

07-07-2019
|

Pergunta

Eu tenho jogado ao redor com dados diferentes agrupamento algoritmos que trabalham em encontrar aglomerados entre pontos de dados aleatórios representou um nós, eu continuo lendo que o agrupamento de dados é utilizado para reconhecimento de imagem. Eu estou deixando de fazer a conexão, como é que o agrupamento ajuda de dados em reconhecer uma imagem ou em reconhecimento facial. alguém pode explicar isso?

Solução

Não é nenhuma surpresa que o agrupamento é usado para reconhecimento de padrões em geral e reconhecimento de imagem em particular: o agrupamento é um processo de redução , e imagens em esta necessidade era megapixel ebulição baixo ... É também um processo que produz categorias e que é, naturalmente, útil.

No entanto, existem muitas abordagens para o uso de clusters como uma técnica de reconhecimento de imagem . Uma das razões para essa diversidade é que o agrupamento pode ser aplicado em diferentes níveis, para diferentes fins:. De nível de pixel nível básico ao recurso (recurso ser uma linha, uma figura geométrica ...), para a classificação ou para outros fins

A um nível muito elevado, agrupamento é uma ferramenta estatística , ele ajuda a descobrir a importância relativa das várias dimensões na definição da pertencendo do item em particular para uma determinada categoria.

Um uso [de muitos] [s] de tal ferramenta, é com aprendizado supervisionado , em que um conjunto de selecionado humano itens (dizer imagens) são alimentados na lógica baseada em cluster, juntamente com uma marca associada a um item específico ( "esta é uma maçã", "esta é uma outra maçã", "este é um limão" ...), o lógica de cluster, em seguida, determina o quanto cada dimensão das questões de entrada para ajudar cada grupo de itens (maçãs, limões ...) se encaixam em um cluster diferente (por exemplo, a cor pode importar relativamente pouco, mas a forma, ou a presença de pontos , ou o que pode importar um lote). Após esta fase de treinamento, novas imagens podem ser alimentados à lógica e ao ver o quão perto a um determinado cluster esta imagem cai, é "reconhecido" (como a banana!).

Quando se trata de processamento de imagem é preciso lembrar que tudo o que é "alimentado" com a lógica de agrupamento não é necessariamente (na verdade, raramente) os pixels matérias, mas vários "objetos" caracterizando vários "elementos" de dados originais (essencialmente um conjunto de vectores de dimensões relativamente elevadas, não ao contrário de alguns que uma pode ter encontrado em outros exemplos de agrupamento outros dados), e produzido por etapas anteriores do processo. Por exemplo, um elemento importante de reconhecimento facial é provavelmente a distância exata entre o centro dos olhos. Nas fases anteriores, a imagem é processada de um modo que descobre onde os olhos são (possivelmente confiando na outra lógica à base de agrupamento). Em seguida, a distância entre os olhos, juntamente com muitos outros elementos são alimentados à lógica de agrupamento final.

A descrição anterior é apenas um exemplo da utilização do agrupamento de reconhecimento de imagem. De facto, várias formas de redes neurais têm sido utilizados, com muito sucesso, neste domínio, e pode-se argumentar que, num sentido estas redes neurais são agrupamento de informações. Uma das razões para o sucesso de redes neurais pode estar na sua capacidade de ser mais respeitoso com o localidade dimensão como encontrado na entrada original, e também a sua capacidade de trabalho em um forma hierárquica .

Uma boa conclusão a este escrever seria uma pequena lista de recursos on-line, mas estou pressionado pelo tempo, no momento ... "para ser continuado"; -)

No dia seguinte, editar : (falhou tentativa de fornecer uma bibliografia on-line introdutório sobre o assunto)

A minha busca de literatura sobre o tema do agrupamento aplicada a visão artificial e processamento de imagem revelou duas distintas ... aglomerados; -)

Livros como Algoritmos para processamento de imagens e visão computacional J Parkey pub Wiley, ou Visão de máquina: Teoria, Algoritmos, Practicalities M Seul et. Al Cambridge UP. Tais livros geralmente cobrir as todas as técnicas importantes associadas com a redução do ruído, a detecção de borda, a cores ou a intensidade de conversão, e muitos outros elementos da cadeia de processamento de imagem, a maioria dos quais não envolvem agregação ou mesmo os métodos estatísticos, e oy reserva só um capítulo ou dois, ou mesmo menor menciona, para clustering, como aplicado ao reconhecimento de padrões ou para outras tarefas.
trabalhos acadêmicos e manuais de conferências, que técnicas especificamente cobrir clusters aplicada à visão artificial e tal, mas na forma mais estreita e mais profunda (ex: Variações sobre o algoritmo Fukunaga e Narendra, para aplicações em reconhecimento de caracteres, ou métodos rápidos para seleções dos mais próximos candidatos vizinho em qualquer contexto.)

Em suma sensação que eu mal equipados para fazer qualquer livro ou artigo específico sugestão.

Você pode achar que é informativo para títulos de navegação em livros dizem que o Google, digitando por "visão artificial" ou "Reconhecimento de Imagem" ou algum ou os títulos mencionados acima. Com o recurso de visualização e também a nuvem de tags (btw outro aplicativo de agrupamento) encontrada no link "Sobre este livro", pode-se ter uma boa idéia dos vários conteúdos livros e talvez decidir comprar alguns deles. Infelizmente o número de leitores reduzida e as aplicações potencialmente lucrativas no campo fazer estes livros relativamente caro. No outro extremo do espectro, você pode fazer o download, por vezes, para, trabalhos de pesquisa gratuitos discutindo tópicos avançados no campo. Estes também vai aparecer no regulares (web) Google, ou pelo repositórios especializados, como CiteSeer .

Boa sorte com sua exploração nesse campo!

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow