为清晰起见编辑 我使用R而且我有一组由订单日组成的数据:
> orders <- data.frame(order.num=1:4,
+ day = c("Mon", "Mon", "Mon", "Tue"))
> orders
order.num day
1 1 Mon
2 2 Mon
3 3 Mon
4 4 Tue
...
订单通常在一致的日子(上周例子中)进行,但有时它们会在隔天进行(例如上周二)。
这是实际数据,使用dplyr :: spread function
扩展到列中 Outlet.number Sun Mon Tue Wed Thu Fri Sat
1 1 0 530 162 0 629 49 0
2 2 0 784 123 0 854 65 0
3 3 24 15 483 0 365 0 0
对于Outlet 1,&#34;典型&#34;订单日期为周一和周四 对于Outlet 2,&#34;典型&#34;订单日期为周一和周四 对于Outlet 3,&#34;典型的&#34;订单天数是周二和周四
我希望能够预测非典型日的订单(例如Tue for Outlet 1)是否更可能与第一个典型的一天(星期一)或第二个典型的一天(星期四)相关联
这些例子都没有在星期三有任何订单,所以我能够硬编码这个小集,但对于未来的网点,星期三可能是典型的或非典型的一天。
有没有办法摄取如上所示的数据然后对它们进行分类?