extraire les informations de cluster du dendrogramme généré
-
28-10-2019 - |
Question
Dans le graphique de dendrogramme généré, la colonne marque la coupure de distance. Existe-t-il un moyen d'obtenir les informations de cluster pour chacune de ces coupures de distance. En particulier, comment faire cela dans Matlab ou en R?
La solution
Si X
est votre ensemble de données, alors dans Matlab la commande
Z = linkage(X);
(nécessite des statistiques à outils) effectuera une analyse de cluster hiérarchique pour vous. Z
est une matrice (m-1) -BY-3, où m est le nombre de lignes de X
. Les première et deuxième colonnes de Z
Vous donnez les indices des points de données ou des centroïdes de cluster qui ont été fusionnés ensemble à chaque nœud du dendrogramme, et la troisième colonne vous donne la coupure de distance à ce nœud.
C'est ce que vous demandez?