حساب المجموع التراكمي لمستويات متغير التداخل
سؤال
آمل أن أحسب متغير المجموع التراكمي، ولكن يتم حسابه ضمن مستويات متغير تداخل معين.فيما يلي بعض الأمثلة على البيانات:
data <- data.frame(cbind(ids=c(rep(1,6),rep(2,4),rep(3,3)), values=c(1,5,2,7,3,5,1,6,2,4,1,6,3)))
أريد متجهًا جديدًا يبدو كالتالي:
data$cumsum <- c(1,6,8,15,18,23,1,7,9,13,1,7,10)
مع منتج نهائي مثل هذا:
> data
ids values cumsum
1 1 1 1
2 1 5 6
3 1 2 8
4 1 7 15
5 1 3 18
6 1 5 23
7 2 1 1
8 2 6 7
9 2 2 9
10 2 4 13
11 3 1 1
12 3 6 7
13 3 3 10
شكرًا!
المحلول
يمكنك استخدام ave
:
transform(data, cumsum = ave(values, ids, FUN = cumsum))
data
# ids values cumsum
#1 1 1 1
#2 1 5 6
#3 1 2 8
#4 1 7 15
#5 1 3 18
#6 1 5 23
#7 2 1 1
#8 2 6 7
#9 2 2 9
#10 2 4 13
#11 3 1 1
#12 3 6 7
#13 3 3 10
أو باستخدام dplyr
:
library(dplyr)
data %>% group_by(ids) %>% mutate(cumsum = cumsum(values))
نصائح أخرى
ينبغي أن يكون أسرع مع data.table
لمجموعات البيانات الكبيرة
library(data.table)
setDT(data)[, Cumsum:=cumsum(values), by=ids]
data
# ids values Cumsum
# 1: 1 1 1
# 2: 1 5 6
# 3: 1 2 8
# 4: 1 7 15
# 5: 1 3 18
# 6: 1 5 23
# 7: 2 1 1
# 8: 2 6 7
# 9: 2 2 9
# 10: 2 4 13
# 11: 3 1 1
# 12: 3 6 7
# 13: 3 3 10
لا تنتمي إلى StackOverflow