Aggiungi etichette di sottogruppi a un grafico del jitter in ggplot2
Domanda
Ho un diagramma quasi a scatola come il jitter-plot:
dt <- rbind(se,cb,cb.se)
qplot(ds, size, data=dt, geom="jitter", colour=root, facets = test ~ .)
Mi piacerebbe inserire un'etichetta riepilogativa per ciascun gruppo al centro della trama, ad esempio qui le dimensioni totali:
aggregate(list(size=dt$size), list(dt$ds, dt$test), sum)
Group.1 Group.2 size
1 b217 se 9847
2 c10 se 97296
3 c613 se 21633
4 c7 se 207540
...
Ho provato a usare + geom_text(aes(x=ds, y=128, label=sum(size)), size=2)
per aggiungere etichette, ma ottengo la stessa etichetta su ogni posizione: come posso ottenere la somma solo di quella sezione di dati?
Modificare:Ecco dove mi trovo adesso, forse sto semplicemente andando nella direzione sbagliata
data <- rbind(se,cb,cb.se)
labels <-ddply(data, c("ds", "test"), function(df) sum(df$size))
ggplot(data=data, aes(x=ds)) +
geom_jitter(aes(y=size, colour=root)) +
geom_text(data=labels, aes(x=ds, y=600, label=V1), size=3) +
facet_wrap(test ~ .)
Questo codice non funziona: ricevo un file undefined columns selected
errore...in qualche luogo.Forse è a causa del multiplo data=
sezioni?
Soluzione
Poiché non fornisci dati di esempio, dimostrerò una soluzione utilizzando dati casuali.
set.seed(1)
n <- 100
dat <- data.frame(
ds = sample(paste("x", 1:8, sep=""), n, replace=TRUE),
size = runif(n, 0, 250),
root = sample(c(TRUE, FALSE), n, replace=TRUE),
test = sample(c("se", "cb", "cb.se"), n, replace=TRUE)
)
head(dat)
ds size root test
1 x3 163.68098 TRUE cb.se
2 x3 88.29932 TRUE se
3 x5 67.56504 FALSE cb
4 x8 248.17102 TRUE cb
5 x2 158.37332 TRUE cb
6 x8 53.30203 FALSE cb.se
p <- ggplot(dat, aes(x=ds, y=size)) +
geom_jitter(aes(colour=root)) +
facet_grid(test~.)
Creare il frame di dati contenente i dati dell'etichetta.Notare l'uso di summarize
.Questo dice ddply
per creare una nuova colonna in data.frame
labels <- ddply(dat, .(ds, test), summarize, size=round(sum(size), 0))
head(labels)
ds test size
1 x1 cb 193
2 x1 cb.se 615
3 x1 se 274
4 x2 cb 272
5 x2 cb.se 341
6 x2 se 1012
p + geom_text(aes(x=ds, label=size, y=128), data=labels, size=2)
Altri suggerimenti
Dai un'occhiata qui.Potrebbe essere utileAggiunta di etichette dirette a ggplot2 e ai grafici reticolari