我有一个包含日期,这些日期之间的间隔和订单数量的数据集:
set.seed(13)
ord.interval <- sample(c(14, 28, 42),
size = 25,
replace = TRUE,
prob = c(0.7, 0.2, 0.1))
week <- as.Date("2013-01-13")
for (i in 2:25) {
week[i] <- week[i-1] + ord.interval[i]
}
set.seed(13)
ord.qty <- sample(c(0,1,2,3),
size = 25,
replace = T,
prob = c(0.2, 0.6, 0.1, 0.1))
df <- data.frame(week, ord.interval, ord.qty)
我们假设它是2014-04-06(我们的数据集中的最后一周后两周),我想知道我应该建议的那个日期的order.qty。什么是最好的算法方法?
我尝试实施以下类型的解决方案:
if: (number of days since last order) >= (average interval between last 7 orders)
then: suggest the average of the last 7 order.qty
else: suggest 0
但可变性太高而无法使用滚动平均值。有没有更好的方法来尝试预测这一点,或者我是在盯着机器学习,而我只是不够聪明才能实现它?