Pergunta

Estou tentando detectar o quão bem um vetor de entrada se encaixa em um determinado centro de cluster. Eu posso encontrar a melhor correspondência com bastante facilidade (o centro com a distância euclidiana mínima do vetor de entrada é a melhor), no entanto, agora preciso trabalhar o quão bom é uma correspondência.

Para fazer isso, preciso encontrar o spread (desvio padrão?) Dos vetores que constroem o centróide e, em seguida, ver se a distância do meu vetor de entrada ao centro é menor que a propagação. Se for mais do que o spread do que eu poderia dizer que não tenho clusters para encaixá -lo (dado que o melhor não se encaixa bem no vetor de entrada).

Não tenho certeza de como encontrar o spread por cluster. Eu tenho todos os vetores centrais e todos os vetores de treinamento são rotulados com seu cluster mais próximo, eu simplesmente não consigo entender exatamente o que preciso fazer para obter a propagação.

Espero que esteja claro? Se não vou tentar reformular! Tia Ian

Foi útil?

Solução

Use a função de distância e calcule a distância do ponto central até cada ponto marcado e descubra a média dessas distâncias. Isso deve lhe dar o desvio padrão.

Outras dicas

Se você mudar para usar um algoritmo diferente, como a mistura de gaussianos, você obtém o espalhar (por exemplo, std. Desvio) como parte do modelo (resultado de agrupamento).

http://home.deib.polimi.it/matteucc/clustering/tutorial_html/mixture.html

http://en.wikipedia.org/wiki/mixture_model

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top