Question

Dans le graphique de dendrogramme généré, la colonne marque la coupure de distance. Existe-t-il un moyen d'obtenir les informations de cluster pour chacune de ces coupures de distance. En particulier, comment faire cela dans Matlab ou en R?

Était-ce utile?

La solution

Si X est votre ensemble de données, alors dans Matlab la commande

Z = linkage(X);

(nécessite des statistiques à outils) effectuera une analyse de cluster hiérarchique pour vous. Z est une matrice (m-1) -BY-3, où m est le nombre de lignes de X. Les première et deuxième colonnes de Z Vous donnez les indices des points de données ou des centroïdes de cluster qui ont été fusionnés ensemble à chaque nœud du dendrogramme, et la troisième colonne vous donne la coupure de distance à ce nœud.

C'est ce que vous demandez?

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top