基于与R中观察到的模式的相似性对观察进行分类

时间:2016-08-02 16:38:30

标签: r

为清晰起见编辑 我使用R而且我有一组由订单日组成的数据:

> orders <- data.frame(order.num=1:4,
+                      day = c("Mon", "Mon", "Mon", "Tue"))
> orders
  order.num day
1         1 Mon
2         2 Mon
3         3 Mon
4         4 Tue
...

订单通常在一致的日子(上周例子中)进行,但有时它们会在隔天进行(例如上周二)。

这是实际数据,使用dplyr :: spread function

扩展到列中
  Outlet.number Sun Mon Tue Wed Thu Fri Sat
1             1   0 530 162   0 629  49   0
2             2   0 784 123   0 854  65   0
3             3  24  15 483   0 365   0   0

对于Outlet 1,&#34;典型&#34;订单日期为周一和周四 对于Outlet 2,&#34;典型&#34;订单日期为周一和周四 对于Outlet 3,&#34;典型的&#34;订单天数是周二和周四

我希望能够预测非典型日的订单(例如Tue for Outlet 1)是否更可能与第一个典型的一天(星期一)或第二个典型的一天(星期四)相关联

这些例子都没有在星期三有任何订单,所以我能够硬编码这个小集,但对于未来的网点,星期三可能是典型的或非典型的一天。

有没有办法摄取如上所示的数据然后对它们进行分类?

0 个答案:

没有答案