我目前正在按每小时的时间序列(来自M4预测竞赛[1]的数据集)测试先知套餐。有趣的是,该数据集不包含有关时间序列的任何时间戳信息(年/月/日/小时),仅包含原始观测值。由于先知期望一个带有ds(日期类型)和y(时间序列)的数据帧,因此我不得不综合生成一个时间戳向量来适应这种情况。以下是该代码段的摘录:
ts <- seq(from = as.POSIXct("2012-05-15 07:00"), length.out = 700, by = "hour")
history <- data.frame(ds = ts, y = time_series_data)
ts_fit <- prophet(history, daily.seasonality = TRUE, weekly.seasonality = TRUE, yearly.seasonality = FALSE)
我的问题是,综合生成此类时间戳是否会影响模型的整体性能?换句话说,如果我将时间戳更改为另一个seq(from = as.POSIXct("2013-05-15 07:00"), length.out = 700, by = "hour")
,这会影响预测准确性吗?
而且,在没有时间戳信息的情况下,这也是处理时间序列的正确方法吗?还是有其他选择? (先知)
谢谢, Kasun。