Adicione os rótulos de subgrupo a uma trama de instabilidade no GGPlot2
Pergunta
Eu tenho um plano quase proibido como o plot de jitter:
dt <- rbind(se,cb,cb.se)
qplot(ds, size, data=dt, geom="jitter", colour=root, facets = test ~ .)
Eu adoraria colocar um rótulo resumido para cada grupo no meio da trama - por exemplo, o tamanho dos totais aqui:
aggregate(list(size=dt$size), list(dt$ds, dt$test), sum)
Group.1 Group.2 size
1 b217 se 9847
2 c10 se 97296
3 c613 se 21633
4 c7 se 207540
...
Eu tentei usar + geom_text(aes(x=ds, y=128, label=sum(size)), size=2)
Para adicionar rótulos, mas recebo o mesmo rótulo em cada posição - como posso obter a soma apenas da seção de dados?
Editar:Aqui é onde estou agora - talvez eu esteja apenas indo na direção errada
data <- rbind(se,cb,cb.se)
labels <-ddply(data, c("ds", "test"), function(df) sum(df$size))
ggplot(data=data, aes(x=ds)) +
geom_jitter(aes(y=size, colour=root)) +
geom_text(data=labels, aes(x=ds, y=600, label=V1), size=3) +
facet_wrap(test ~ .)
Este código não funciona - eu recebo um undefined columns selected
erro ... em algum lugar. Talvez seja por causa do múltiplo data=
Seções?
Solução
Como você não fornece dados de amostra, demonstrarei uma solução usando dados aleatórios.
set.seed(1)
n <- 100
dat <- data.frame(
ds = sample(paste("x", 1:8, sep=""), n, replace=TRUE),
size = runif(n, 0, 250),
root = sample(c(TRUE, FALSE), n, replace=TRUE),
test = sample(c("se", "cb", "cb.se"), n, replace=TRUE)
)
head(dat)
ds size root test
1 x3 163.68098 TRUE cb.se
2 x3 88.29932 TRUE se
3 x5 67.56504 FALSE cb
4 x8 248.17102 TRUE cb
5 x2 158.37332 TRUE cb
6 x8 53.30203 FALSE cb.se
p <- ggplot(dat, aes(x=ds, y=size)) +
geom_jitter(aes(colour=root)) +
facet_grid(test~.)
Crie o quadro de dados que contém dados do rótulo. Observe o uso de summarize
. Isso diz ddply
Para criar uma nova coluna para os dados.
labels <- ddply(dat, .(ds, test), summarize, size=round(sum(size), 0))
head(labels)
ds test size
1 x1 cb 193
2 x1 cb.se 615
3 x1 se 274
4 x2 cb 272
5 x2 cb.se 341
6 x2 se 1012
p + geom_text(aes(x=ds, label=size, y=128), data=labels, size=2)
Outras dicas
Dê uma olhada aqui. Pode ser útilAdicionando etiquetas diretas às parcelas GGPlot2 e da rede