我不熟悉按组进行时间序列预测。
我有一个庞大的每日时间序列数据集,需要对其进行预测。
我做了很多谷歌搜索,并尝试了许多不同的方法,但是都没有成功。
date country device os browser visits clicks logins sale
7/29/2018 USA desktop Windows Firefox 3046 1523 762 381
7/29/2018 USA mobile Windows Firefox 6546 3273 1637 818
7/29/2018 USA tablet Windows Firefox 864 432 216 108
7/30/2018 USA desktop Windows Firefox 11004 5502 2751 1376
7/30/2018 USA mobile Windows Firefox 7938 3969 1985 992
7/30/2018 USA tablet Windows Firefox 1114 557 279 139
7/31/2018 USA desktop Windows Firefox 10814 5407 2704 1352
7/31/2018 USA mobile Windows Firefox 7560 3780 1890 945
7/31/2018 USA tablet Windows Firefox 984 492 246 123
这是我生成的示例数据集,因为我找不到其他任何可以正确代表我的问题的开放数据集。 (很抱歉,如果样本数量不正确)
我希望通过“国家/地区”,“设备”,“操作系统”和“浏览器”来预测此数据集在接下来的“ n”天内每天的“访问,点击,登录,销售”。
任何帮助将不胜感激。
答案 0 :(得分:2)
这正是我们正在开发tsibble
和fable
软件包的用例。 tsibble
在CRAN(https://cran.r-project.org/package=tsibble)上,而fable
仍然仅在github(https://github.com/tidyverts/fable)上。
您可以执行以下操作来通过clicks
,country
,device
和os
来预测browser
:
library(tsibble)
library(fable)
mydata <- tsibble(dataframe, key = c(country, device, os, browser), index=date)
mydata %>%
model(ETS(clicks)) %>%
forecast()