Albero del consenso o "proporzioni bootstrap" da più oggetti hclust
-
10-07-2019 - |
Domanda
Ho un elenco di oggetti hclust risultanti da lievi variazioni in una variabile (per il calcolo della matrice della distanza)
- ora vorrei fare un albero di consenso da questo elenco.
Esiste un pacchetto generico per farlo? Mi sto facendo strada un po 'di codice da maanova e sembra funzionare - ma è brutto e lo fa ha bisogno di molto hacking poiché non sto facendo "normale" bootstrap (è dati chimici).
/ Palle Villesen, Danimarca
c1_list <- seq(10,100,by=10)
c2 <- 30
e<- 1
mboot <- list()
for (i in 1: length(c1_list) ) {
c1 <- c1_list[i]
cat("Doing C1=",c1,"...")
x <- hclust(custom_euclidean(t(log2(data[, all]+1)), c1,c2,e), method='average')
cat("..done\n")
mboot[[i]] <- x # To get hclust object back use mbot[[i]] to get i'th object
}
#### Now extract the robust groups from mboot...
Soluzione
Per prima cosa, dai un'occhiata a Codice di Allan Tucker per il clustering del consenso , in relazione al suo articolo " Clustering del consenso e interpretazione funzionale dei dati di espressione genica " .
Ecco alcuni altri suggerimenti:
- Hai menzionato che stai utilizzando il pacchetto maanova ; questo può creare un albero di consenso dal risultato del cluster bootstrap con la funzione
consensus ()
. Ci hai provato? - Il pacchetto scimmia è destinato all'analisi dell'albero filogenetico, quindi è forse non del tutto pertinente, ma potresti esaminarlo. C'è un esempio usando hclust su R-Help .
- Allo stesso modo, il pacchetto nem, che fa parte del bioconduttore ha alcuni esempi.
Altri suggerimenti
Hm, sembra un approccio di potenziamento applicato al clustering e una rapida ricerca su Google rivela una letteratura abbastanza esistente su potenziamento del clustering . Forse è un inizio?
Per quanto riguarda il codice R, ci sono sempre le viste attività su Clustering e Apprendimento automatico .