Pregunta

Tengo un conjunto de datos que se parece a esto ...

mine tonnes week
AA   112    41
AA   114    41
AA   119    41
BB   108    41 
BB   112    41
AA   110    42
AA   109    42
AA   102    43
AA   101    43

Y yo quiero crear un diagrama de caja en ggplot2 para mostrar la distribución de toneladas por cada semana. Pero yo sólo quiero resultados de mina de AA.

pensé que funcionaría como esto ....

qplot(factor(week), tonnes[mine == "AA"], data = sql_results, geom = "boxplot")

Pero en cambio, me sale este error.

Error in data.frame(x = c(13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L,  :

  arguments imply differing number of rows: 423100, 109436

Es probablemente muertos sencilla, pero no estoy teniendo mucha suerte averiguar la forma correcta de hacerlo.

¿Fue útil?

Solución

cerrar. En el ejemplo que ha creado un subconjunto de toneladas, pero no de la semana.

sql_results<-structure(list(mine = structure(c(1L, 1L, 1L, 2L, 2L, 1L, 1L, 
1L, 1L), .Label = c("AA", "BB"), class = "factor"), tonnes = c(112, 
114, 119, 108, 112, 110, 109, 102, 101), week = c(41, 41, 41, 
41, 41, 42, 42, 43, 43)), row.names = c("1", "2", "3", "4", "5", 
"6", "7", "8", "9"), .Names = c("mine", "tonnes", "week"), class = "data.frame")

qplot(factor(week), tonnes, data = subset(sql_results,mine=="AA"), geom = "boxplot")
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top