循环中的data.table列分配

时间:2017-04-11 15:59:23

标签: r data.table apply lapply

这就是我的data.table的样子。最右边的三列是我的所需列。

 library(data.table)
    dt <- fread('
        Product  Sales    A-CumSales   B-CumSales  C-CumSales 
        A          10        10            0          0
        B          5         10            5          0
        A          10        20            5          0
        A          20        40            5          0
        B          10        40           15          0
        C          5         40           15          5
        C          5         40           15          10
    ')
 dt[, Product:= as.factor(Product)]

我的Product列中的级别总是在变化。我正在尝试循环,我为每个Product创建一个单独的列,用于计算相应Sales的累积Product

我试过了:

for (i in levels(dt$Product)) {
  dt[,i:= cumsum((Product == "i") * Sales)]
}

1 个答案:

答案 0 :(得分:2)

以下是基于OP代码尝试的内容:

dt <- dt[, .(Product, Sales)]

plevels <- levels(dt$Product)

dt[, c(paste(plevels, 'CumSales', sep = '-')) :=
        lapply(plevels, function(x) cumsum(Sales * (Product == x)))]

#    Product Sales A-CumSales B-CumSales C-CumSales
# 1:       A    10         10          0          0
# 2:       B     5         10          5          0
# 3:       A    10         20          5          0
# 4:       A    20         40          5          0
# 5:       B    10         40         15          0
# 6:       C     5         40         15          5
# 7:       C     5         40         15         10