Métodos de classificação não supervisionados disponíveis

https://stackoverflow.com/questions/1754873

20-09-2019
|

Pergunta

Estou fazendo uma pesquisa que envolve "classificação não supervisionada". Basicamente, tenho um conjunto de trens e quero agrupar dados em x número de classes de maneira não supervisionada. A ideia é semelhante ao que K-Means faz.

Digamos

Etapa1) O PROPSSIMET é uma matrice [1057x10] e quero agrupar -os em 88 clusters.

Etapa2) Use classes calculadas anteriormente para calcular como os dados do teste são classificados

Pergunta -É possível fazer isso com SVM ou NN? Algo mais ? -Has outras recomendações?

Solução

Existem muitos algoritmos de cluster por aí, e a Web está repleta de informações sobre eles e implementações de amostra. Um bom ponto de partida é a entrada da Wikipedia sobre análise de cluster Cluster_analysis.

Como você tem uma implementação de K-Means em funcionamento, você pode tentar uma das muitas variantes para ver se elas são melhores resultados (K-Means ++, talvez, visto que você mencionou SVM). Se você deseja uma abordagem completamente diferente, dê uma olhada nos mapas de Kohonen - também chamados de mapas de recursos auto -organizadores. Se isso parecer complicado demais, seria fácil implementar um cluster hierárquico simples (encontre os dois itens mais próximos, combine, enxaguar e repetir).

Outras dicas

Isso soa como um problema clássico de agrupamento. Nem SVMS ou redes neurais serão capazes de resolver diretamente esse problema. Você pode usar qualquer abordagem para redução de dimensionalidade, por exemplo, para incorporar seus dados 10-dimensionais no espaço bidimensional, mas eles não colocarão os dados em clusters para você.

Há um grande número de algoritmos de agrupamento além do K-Means. Se você quisesse uma abordagem contrastante, pode querer experimentar um clustering aglomerativo algoritmo. Não sei que tipo de ambiente de computação você está usando, mas eu gosto bastante R e Este guia (muito) curto sobre agrupamento.

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow