somas cumulativas, médias móveis, e “grupo por” SQL equivalentes em R
-
19-09-2019 - |
Pergunta
O que é a maneira mais eficiente para criar uma soma média ou rolando movendo-se em R? Como você faz a função rolando junto com um "grupo por"?
Solução
Enquanto zoológico é grande, por vezes, existem maneiras mais simples. Se comporta-lhe dados muito bem, e é uniformemente espaçados, a função de incorporar () efetivamente permite criar múltiplas versões desfasado de uma série temporal. Se você olhar dentro do pacote VARS para auto-regressão vetorial, você vai ver que o autor do pacote escolhe esse caminho.
Por exemplo, para calcular o período de 3 rolando médio de x, em que x = (1 -> 20) ^ 2:
> x <- (1:20)^2
> embed (x, 3)
[,1] [,2] [,3]
[1,] 9 4 1
[2,] 16 9 4
[3,] 25 16 9
[4,] 36 25 16
[5,] 49 36 25
[6,] 64 49 36
[7,] 81 64 49
[8,] 100 81 64
[9,] 121 100 81
[10,] 144 121 100
[11,] 169 144 121
[12,] 196 169 144
[13,] 225 196 169
[14,] 256 225 196
[15,] 289 256 225
[16,] 324 289 256
[17,] 361 324 289
[18,] 400 361 324
> apply (embed (x, 3), 1, mean)
[1] 4.666667 9.666667 16.666667 25.666667 36.666667 49.666667
[7] 64.666667 81.666667 100.666667 121.666667 144.666667 169.666667
[13] 196.666667 225.666667 256.666667 289.666667 324.666667 361.666667
Outras dicas
Eu arranhada uma boa resposta de Achim Zeileis mais na lista r. Eis o que ele disse:
library(zoo)
## create data
x <- rnorm(365)
## transform to regular zoo series with "Date" index
x <- zooreg(x, start = as.Date("2004-01-01")) plot(x)
## add rolling/running/moving average with window size 7
lines(rollmean(x, 7), col = 2, lwd = 2)
## if you don't want the rolling mean but rather a weekly ## time series of means you can do
nextfri <- function(x) 7 * ceiling(as.numeric(x - 1)/7) + as.Date(1) xw <- aggregate(x, nextfri, mean)
## nextfri is a function which computes for a certain "Date" ## the next friday. xw is then the weekly series.
lines(xw, col = 4)
Achim passou a dizer:
Note, que a diferença entre é rolando significativo e a série de agregados é devido a diferentes alinhamentos. Esta pode ser mudada mudando a 'align' argumento em
rollmean()
ou o funçãonextfri()
no agregado ligar.
Tudo isso veio de Achim, não de mim: http://tolstoy.newcastle.edu.au/R/ ajuda / 05/06 / 6785.html