我是KNIME的新手,并尝试使用ARIMA来推断我的时间序列数据。但是我没有让ARIMA Predictor做它的工作。
输入数据具有以下格式
year,cv_diff
2011,-4799.099999999977
2012,60653.5
2013,64547.5
2014,60420.79999999993
我想预测2015年和2016年的价值。
我使用字符串到日期/时间节点来转换年份。在ARIMA学习者中,我只能选择cv_diff字段。这是第一个问题:对于包含单变量时间序列的选项'我应该设置我要预测的年份列或变量吗?但在我的情况下,我只有一个选项--cv_diff变量。之后,我将学习者的输出与ARIMA Predictor的输入连接并执行。执行失败了' ERROR ARIMA预测器2:3执行失败:找不到具有已定义时间序列的列。请重新配置节点。'
帮助我了解我应该为学习者和预测者设置哪个变量?它应该是非时间序列变量吗?那么Arima节点如何理解哪个列用作时间序列?
答案 0 :(得分:1)
答案 1 :(得分:0)
最后,我已经弄明白了。 ARIMA Learner节点的选项'包含单变量时间序列的列'似乎有点混乱,特别是对于那些不熟悉时间序列分析的人。我不应该明确地提供任何时间序列字段,因为ARIMA会以相等的时间间隔处理将要进行预测的变量,并且它们的间隔并不重要。
我发现“单变量时间序列”意味着好explanation
The term "univariate time series" refers to a time series that
consists of single (scalar) observations recorded sequentially over equal time increments. Some examples are monthly CO2 concentrations and southern
oscillations to predict el nino effects.
Although a univariate time series data set is usually given as a single column of numbers, time is in fact an implicit variable in the time series. If the data are equi-spaced, the time variable, or index, does not need to be explicitly given. The time variable may sometimes be explicitly used for plotting the series. However, it is not used in the time series model itself.
因此,我应该为学习者和预测者选择 cv_diff 变量,并且不提供任何时间戳或任何其他时间相关的列。
还有一件事我不明白。我应该训练一些系列的数据,然后提供另一个我想要预测的系列。当您只需提供新数据且根本没有系列概念时,这与其他机器学习工作流程略有不同。