Вычислить совокупную сумму для уровней переменной вложенности

StackOverflow https://stackoverflow.com//questions/25086798

  •  02-01-2020
  •  | 
  •  

Вопрос

Я надеюсь вычислить совокупную переменную сумму, но вычисляется на уровне данной переменной вложенности.Вот несколько примеров данных:

data <- data.frame(cbind(ids=c(rep(1,6),rep(2,4),rep(3,3)), values=c(1,5,2,7,3,5,1,6,2,4,1,6,3)))
.

Я хочу нового вектора, который бы выглядел так:

data$cumsum <- c(1,6,8,15,18,23,1,7,9,13,1,7,10)
.

с конечным продуктом, как это:

> data
    ids values cumsum
1    1      1      1
2    1      5      6
3    1      2      8
4    1      7     15
5    1      3     18
6    1      5     23
7    2      1      1
8    2      6      7
9    2      2      9
10   2      4     13
11   3      1      1
12   3      6      7
13   3      3     10
.

Спасибо!

Это было полезно?

Решение

Вы можете использовать ave:

transform(data, cumsum = ave(values, ids, FUN = cumsum))

data
#   ids values cumsum
#1    1      1      1
#2    1      5      6
#3    1      2      8
#4    1      7     15
#5    1      3     18
#6    1      5     23
#7    2      1      1
#8    2      6      7
#9    2      2      9
#10   2      4     13
#11   3      1      1
#12   3      6      7
#13   3      3     10
.

или используя dplyr:

library(dplyr)
data %>% group_by(ids) %>% mutate(cumsum = cumsum(values))
.

Другие советы

должен быть быстрее с data.table для больших наборов данных

library(data.table) 
setDT(data)[, Cumsum:=cumsum(values), by=ids]
data
#      ids values Cumsum
 # 1:   1      1      1
#  2:   1      5      6
#  3:   1      2      8
#  4:   1      7     15
#  5:   1      3     18
#  6:   1      5     23
#  7:   2      1      1
#  8:   2      6      7
#  9:   2      2      9
# 10:   2      4     13
# 11:   3      1      1
# 12:   3      6      7
# 13:   3      3     10
.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top