Pregunta

Estoy haciendo una investigación que implica "clasificación no supervisada". Básicamente tengo un tren y quiero agrupar los datos en un número X de clases en forma no supervisada. Idea es similar a lo que hace k-medias.

Digamos

Paso 1) featureSet es un [1057x10] matrice y quiero agruparlas en 88 grupos.

Paso 2) Utilizar las clases previamente calculadas para calcular cómo el TestData se clasifica

Pregunta -¿Es posible hacerlo con SVM o N-N? Algo más ? -Cualquier otras recomendaciones?

¿Fue útil?

Solución

Hay muchos algoritmos de agrupamiento por ahí, y la web está llena de información sobre ellos y las implementaciones de muestra. Un buen punto de partida es la entrada de Wikipedia sobre análisis de conglomerados Cluster_analysis .

A medida que usted tiene una aplicación de k-medias de trabajo, usted podría tratar de una de las muchas variantes para ver si yeild mejores resultados (k-medias ++ tal vez, ya que usted ha mencionado SVM). Si quieres un enfoque completamente diferente, echar un vistazo a Kohonen Mapas - también llamado auto-organización Característica Maps. Si esto parece demasiado complicado, un simple agrupación jerárquica sería fácil de implementar (encontrar los dos elementos más cercanos, combinar, aclarar y repetir).

Otros consejos

Esto suena como un problema de agrupamiento clásico. Ni las SVM o redes neuronales van a ser capaces de resolver este problema directamente. Puede utilizar cualquiera de los enfoques para reducción de dimensionalidad , por ejemplo, para incrustar los datos de 10-dimensionales en dos el espacio dimensional, pero no va a poner los datos en clústeres para usted.

Hay un gran número de algoritmos de agrupamiento, además de k-medias. Si quieres un enfoque de contraste, es posible que desee probar un aglomeración agrupación algoritmo. No sé qué tipo de ambiente que está utilizando la computación, pero me gusta bastante R y < a href = "http://www.statmethods.net/advstats/cluster.html" rel = "nofollow noreferrer"> este (muy) guía corto en la agrupación .

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top