R-如何按组预测具有多个变量的每日时间序列

时间:2018-10-27 19:48:31

标签: r time-series tidyverse forecasting forecast

我不熟悉按组进行时间序列预测。

我有一个庞大的每日时间序列数据集,需要对其进行预测。

我做了很多谷歌搜索,并尝试了许多不同的方法,但是都没有成功。

date    country device  os  browser visits  clicks  logins  sale
7/29/2018   USA desktop Windows Firefox 3046    1523    762 381
7/29/2018   USA mobile  Windows Firefox 6546    3273    1637    818
7/29/2018   USA tablet  Windows Firefox 864 432 216 108
7/30/2018   USA desktop Windows Firefox 11004   5502    2751    1376
7/30/2018   USA mobile  Windows Firefox 7938    3969    1985    992
7/30/2018   USA tablet  Windows Firefox 1114    557 279 139
7/31/2018   USA desktop Windows Firefox 10814   5407    2704    1352
7/31/2018   USA mobile  Windows Firefox 7560    3780    1890    945
7/31/2018   USA tablet  Windows Firefox 984 492 246 123

这是我生成的示例数据集,因为我找不到其他任何可以正确代表我的问题的开放数据集。 (很抱歉,如果样本数量不正确)

我希望通过“国家/地区”,“设备”,“操作系统”和“浏览器”来预测此数据集在接下来的“ n”天内每天的“访问,点击,登录,销售”。

任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:2)

这正是我们正在开发tsibblefable软件包的用例。 tsibble在CRAN(https://cran.r-project.org/package=tsibble)上,而fable仍然仅在github(https://github.com/tidyverts/fable)上。

您可以执行以下操作来通过clickscountrydeviceos来预测browser

library(tsibble)
library(fable)
mydata <- tsibble(dataframe, key = c(country, device, os, browser), index=date)
mydata %>%
  model(ETS(clicks)) %>%
  forecast()