这就是我的data.table的样子。最右边的三列是我的所需列。
library(data.table)
dt <- fread('
Product Sales A-CumSales B-CumSales C-CumSales
A 10 10 0 0
B 5 10 5 0
A 10 20 5 0
A 20 40 5 0
B 10 40 15 0
C 5 40 15 5
C 5 40 15 10
')
dt[, Product:= as.factor(Product)]
我的Product
列中的级别总是在变化。我正在尝试循环,我为每个Product
创建一个单独的列,用于计算相应Sales
的累积Product
。
我试过了:
for (i in levels(dt$Product)) {
dt[,i:= cumsum((Product == "i") * Sales)]
}
答案 0 :(得分:2)
以下是基于OP代码尝试的内容:
dt <- dt[, .(Product, Sales)]
plevels <- levels(dt$Product)
dt[, c(paste(plevels, 'CumSales', sep = '-')) :=
lapply(plevels, function(x) cumsum(Sales * (Product == x)))]
# Product Sales A-CumSales B-CumSales C-CumSales
# 1: A 10 10 0 0
# 2: B 5 10 5 0
# 3: A 10 20 5 0
# 4: A 20 40 5 0
# 5: B 10 40 15 0
# 6: C 5 40 15 5
# 7: C 5 40 15 10