预测跳远结果:这是时间序列预测问题还是回归问题?

时间:2020-04-23 16:15:40

标签: machine-learning model time-series

这是我的数据(简体):

Athletics    Age    Competition    Result(m)
--------------------------------------------
Alex         10.2    CompA          3.2
Alex         11.5    CompB          4.3
...
Bob          9.9     CompC          3.5
Bob          10.7    CompD          5.6
...
Dave         10.3    CompB          5.2
Dave         11.6    CompD          6.3
....

所以我的数据是关于一组不同年龄(8-28岁)儿童在不同比赛中跳远的结果。

我想知道的事情:

  1. 给一个新生的保罗,如果我们知道他的病史(例如8-16岁),如何预测他的未来结果(例如18、20、24岁)?
  2. 如果我们可以根据最佳成绩将跳线归为A-E,那么如何预测保罗将来会属于哪个组(比如说他18岁的时候)?

我最近学到了一些有关机器学习和深度学习的知识,我知道这是可以使用这些模型解决的问题,但是我很困惑应该使用哪种模型。

  1. 我是否应该仅根据Paul的历史数据对Paul(新孩子)进行预测?或者我应该使用Alex,Bob,Dave等其他人的数据来做?
  2. 这是一个时间序列预测问题,应该使用ARIMA,ARCH,LSTM(RNN)等模型吗?
  3. 或者这是一个“正常的”有监督或无监督的回归或分类问题,我应该在其中使用诸如线性回归,逻辑回归,KNN,NB,DT,SVM,随机森林,ANN,DNN,CNN等教科书模型?

任何方向将不胜感激。

2 个答案:

答案 0 :(得分:0)

答案是两者。回归仅表示模型的输出层上没有S型激活。因此,您可以使用时间序列模型(例如LSTM或GRU)(使用这种复杂模型可能会导致过拟合),然后使用它们进行回归。这样,模型将学习其他孩子的表现方式,然后使用数据让Paul预测他的表现如何。这不是分类问题!您正在预测继续价值,而不是阶级。这意味着它必须是回归的。

我建议阅读书籍或学习教程,我喜欢使用Python进行深度学习。

答案 1 :(得分:0)

您要解决的问题通常称为面板(或受监督)预测。

是否使用其他孩子的数据是一个实际的问题。您可以将使用该数据的模型与仅使用Paul数据的模型进行比较。

没有必要使用深度学习,但是您可以尝试。其他标准的机器学习算法(随机森林等)或统计预测算法(ARIMA等)也可以适用于解决此类问题。

很少有库可以立即解决此问题。一个是pysf,其中包含有关天气数据的教程(https://github.com/alan-turing-institute/pysf/blob/master/examples/Walkthrough.ipynb),另一个是gluon-ts(主要是深度学习方法)。