遍历数据框以查找另一个,并修改另一个

时间:2018-07-17 09:43:24

标签: r

我正在创建一个R脚本,以帮助根据订单A的购买量预测订单B的日期。

当前的计划是要有一个SQL脚本来查看销售数据的最后180天,并进行一些处理以创建一个如下所示的数据层,其中包含购买的当天以及当天购买的客户百分比(已经完成)

purchaseCycles

daysSinceA    x1kg   x2kg   x2.5kg x5kg
    0          0.010  0.008  0.006  0.003
    1          0.007  0.006  0.005  0.002
    2          0.006  0.005  0.005  0.004
   ...
    90         0.001  0.002  0.005  0.004

然后我们有一个按大小列出的最近90天销售业绩的矩阵:

last90DaysSalesData

date         x1kg    x2kg   x2.5kg x5kg
 "16/07/18"    5002    300    4120   1290
 "15/07/18"    8122    710    6121   3560
 "14/07/18"    3194    861    7111   1276
   ...
 "17/04/18"    10042   1024   5330   5190

理想的输出将是以上各项的组合所构成的第三个数据帧,其中,一个函数通过last90DaysSalesData迭代到last90DaysSalesData并根据purchaseCycles数据将这些销售额的x%投放到将来的一天。因此,每次迭代都会在以后每天修改90行,从而产生类似以下内容的信息:

future90DaysForecast

date       forecast
"17/07/18"   15222.1
"18/07/18"   6123.5
"19/07/18"     9927.4
   ...
"17/07/18"     20234.1

这样会是正确的方向吗,并且可能在数据帧上进行这种迭代:

future90DaysForecast <- data.frame(Date=as.Date(character()),
             forecast=character()) 

for (day in last90DaysSalesData):
  sales1kg <- day$x1kg
  salesDate <- day$date

  for (day2 in purchaseCycles):
    dayModifier <- day2$daysAhead
    percentReturn <- day2&x1kg
    forecastDate <- salesDate + dayModifier
    forecastSales <- sales1kg * percentReturn

    future90DaysForecast <- rbind(salesDate + dayModifier, forecastSales)

欢迎提出任何想法,

0 个答案:

没有答案