R pregunta ggplot2 - a partir de factores
Pregunta
Tengo un conjunto de datos que se parece a esto ...
mine tonnes week AA 112 41 AA 114 41 AA 119 41 BB 108 41 BB 112 41 AA 110 42 AA 109 42 AA 102 43 AA 101 43
Y yo quiero crear un diagrama de caja en ggplot2 para mostrar la distribución de toneladas por cada semana. Pero yo sólo quiero resultados de mina de AA.
pensé que funcionaría como esto ....
qplot(factor(week), tonnes[mine == "AA"], data = sql_results, geom = "boxplot")
Pero en cambio, me sale este error.
Error in data.frame(x = c(13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, :
arguments imply differing number of rows: 423100, 109436
Es probablemente muertos sencilla, pero no estoy teniendo mucha suerte averiguar la forma correcta de hacerlo.
Solución
cerrar. En el ejemplo que ha creado un subconjunto de toneladas, pero no de la semana.
sql_results<-structure(list(mine = structure(c(1L, 1L, 1L, 2L, 2L, 1L, 1L,
1L, 1L), .Label = c("AA", "BB"), class = "factor"), tonnes = c(112,
114, 119, 108, 112, 110, 109, 102, 101), week = c(41, 41, 41,
41, 41, 42, 42, 43, 43)), row.names = c("1", "2", "3", "4", "5",
"6", "7", "8", "9"), .Names = c("mine", "tonnes", "week"), class = "data.frame")
qplot(factor(week), tonnes, data = subset(sql_results,mine=="AA"), geom = "boxplot")
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow