Albero del consenso o "proporzioni bootstrap" da più oggetti hclust

https://stackoverflow.com/questions/1642119

10-07-2019
|

Domanda

Ho un elenco di oggetti hclust risultanti da lievi variazioni in una variabile (per il calcolo della matrice della distanza)

ora vorrei fare un albero di consenso da questo elenco.

Esiste un pacchetto generico per farlo? Mi sto facendo strada un po 'di codice da maanova e sembra funzionare - ma è brutto e lo fa ha bisogno di molto hacking poiché non sto facendo "normale" bootstrap (è dati chimici).

/ Palle Villesen, Danimarca

c1_list <- seq(10,100,by=10)
c2 <- 30
e<- 1
mboot <- list()
for (i in 1: length(c1_list) ) {
   c1 <- c1_list[i]
   cat("Doing C1=",c1,"...")
   x <- hclust(custom_euclidean(t(log2(data[, all]+1)), c1,c2,e), method='average')
   cat("..done\n")
   mboot[[i]] <- x # To get hclust object back use mbot[[i]] to get i'th object
}

#### Now extract the robust groups from mboot...

Soluzione

Per prima cosa, dai un'occhiata a Codice di Allan Tucker per il clustering del consenso , in relazione al suo articolo " Clustering del consenso e interpretazione funzionale dei dati di espressione genica " .

Ecco alcuni altri suggerimenti:

Hai menzionato che stai utilizzando il pacchetto maanova ; questo può creare un albero di consenso dal risultato del cluster bootstrap con la funzione consensus () . Ci hai provato?
Il pacchetto scimmia è destinato all'analisi dell'albero filogenetico, quindi è forse non del tutto pertinente, ma potresti esaminarlo. C'è un esempio usando hclust su R-Help .
Allo stesso modo, il pacchetto nem, che fa parte del bioconduttore ha alcuni esempi.

Altri suggerimenti

Hm, sembra un approccio di potenziamento applicato al clustering e una rapida ricerca su Google rivela una letteratura abbastanza esistente su potenziamento del clustering . Forse è un inizio?

Per quanto riguarda il codice R, ci sono sempre le viste attività su Clustering e Apprendimento automatico .

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow