滚动百分比沿列添加

时间:2018-03-05 14:40:37

标签: r apply rolling-computation

我认为这在基础R中应该很容易,但我无法弄明白。 我有一个简单的数据框,让我们说它看起来像这个

tbl <-  read.table(text = 
    "Field1 Field2
    100 200
    150 180
    200 160
    280 250
    300 300
    300 250",
header = TRUE)

现在,我想要做的是创建一个将应用滚动%添加的函数,例如:

fn <- function(tbl, pct) {}

接受上面的数据框为tbl。它根据pct将当前行的百分比添加到NEXT行,并且几乎以累积方式滚动。

例如,fn(tbl$Field1, 0.1)会生成以下结果:

100   (100 + 0.1*0)
160   (150 + 0.1*100 = 160)
216   (200 + 0.1*160 = 216)
301.6 (280 + 0.1*216 = 301.6)

我使用套餐解决方案,但更喜欢基地R,因为它有助于学习过程!我的长期目标是通过field和pct的每个组合构建一个循环过程,这样我就可以在回归模型中测试它的效果;因此,我的直觉是,我后来可以应用的功能就是前进的方向。

感谢。

4 个答案:

答案 0 :(得分:5)

filter() functionstats包的一部分,它是基数R.保持小数点后一位:

round(filter(tbl$Field1, 0.1, method="recursive"), 1)

哪会产生以下结果

100.0 160.0 216.0 301.6 330.2 333.0

答案 1 :(得分:4)

您可以使用Reduce()功能,如下所示。

cumpersum = function(x, percent = 0.1) {
  Reduce(function(x1, x2) percent * x1 + x2, x, accumulate = TRUE)
}

dat <- data.frame(
  Field1 = c(100, 150, 200, 280, 300, 300),
  Field2 = c(200, 180, 160, 250, 300, 250)
)

dat$Field1cumper <- cumpersum(dat$Field1, .1)
dat

#   Field1 Field2 Field1cumper
# 1    100    200        100.0
# 2    150    180        160.0
# 3    200    160        216.0
# 4    280    250        301.6
# 5    300    300        330.2
# 6    300    250        333.0

答案 2 :(得分:1)

如果您想使用基本R编写解决方案并使用for循环和索引从基础知识中学习编程,您可以知道您可以编写一个语料库如下所示的函数: / p>

solution= tbl$Field1
for (i in 1:length(tbl$Field1)) {

  if (i==1) {
    solution[1] = tbl$Field1[1] 
  } else {
    solution[i] = tbl$Field1[i] + pct * solution[i-1]
  }
}

虽然我建议你去看看更高级的解决方案。已经提到的lag函数可能很方便。

答案 3 :(得分:1)

很难找到一个不涉及显式循环的解决方案,但我无法想到一个。您可以将所需的结果分解为数字之和乘以pct^c(0, 1, 2, ...),但我认为这只会让您进行大量的额外计算。所以我的解决方案很简单:

fn = function(x, pct) {
  n = length(x)
  result = NA*x
  last_result = 0
  for(i in 1:n) {
    result[i] = last_result = x[i] + last_result*pct
  }
  return(result)
}

fn(tbl$Field1, 0.1)

# [1] 100.000 160.000 216.000 301.600 330.160 333.016