Domanda

Sto cercando di individuare quanto bene un vettore di ingresso si inserisce un determinato centro del cluster. Posso trovare la migliore corrispondenza abbastanza facilmente (il centro con la distanza minima euclidea al vettore di ingresso è la migliore), tuttavia, ora ho bisogno di lavorare come un buon match che è.

Per fare questo ho bisogno di trovare lo spread (deviazione standard?) Dei vettori che edificano il baricentro, poi vedere se la distanza dal mio vettore di ingresso al centro è minore la diffusione. Se si tratta di più che la diffusione di quanto dovrei essere in grado di dire che non ho cluster per adattarlo (dato che i migliori non va bene il pozzo di ingresso vettore).

Non sono sicuro di come trovare la diffusione per cluster. Ho tutti i vettori del centro, e tutti i vettori di addestramento sono etichettate con il loro gruppo più vicino, non riesco proprio a capire del tutto esattamente che cosa devo fare per ottenere la diffusione.

Spero che sia chiaro? Se non cercherò di riformulare esso! TIA Ian

È stato utile?

Soluzione

Utilizzare la funzione di distanza e calcolare la distanza dal punto centrale per ogni punto etichettato, quindi capire la media di quelle distanze. Che dovrebbe darvi la deviazione standard.

Altri suggerimenti

Se si decide di utilizzare un algoritmo diverso, come ad esempio miscela di gaussiane, si ottiene il diffusione (ad esempio, std. Deviazione) come parte del modello (risultato di clustering).

http://home.deib.polimi.it/matteucc/ Clustering / tutorial_html / mixture.html

http://en.wikipedia.org/wiki/Mixture_model

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top