Question

我正在尝试预测路线的难度。一条路线由一系列点组成，每个点相距10米。每个点都有以下信息：

路径宽度
森林密度
坠落速度（坠落时身体会达到的速度）
坡度

对于每条路线，也都有一定的难度。但是这些困难是由不同的人造成的，并且差异很大。因此，一个人给了一条路线4。但是另一个人可能给了这条路线2。因此数据中包含人为错误。

我到目前为止所做的事情：
我计算了每个路线的均值和标准差。因此，我采用了一条路线的所有点，并用它来计算这些统计值。我还添加了一条路线的长度（点数* 10）。（差异=路线的难度。取值范围1-12）

然后，我将这些值放入线性回归模型中。事实证明这是一个不错的开始：

Mean Absolute Error: 1.239902061226418
Mean Squared Error: 2.3566221702532917
Root Mean Squared Error: 1.53512936596669

问题

但是，由于我缺乏机器学习知识，现在我不知道该怎么做。

我有一个使用神经网络的想法，只是提出了所有要点。最长的路线是5300点长，所以我只想说，每条路线5300点输入，并用这些路线的0值填充点，这还不够长。诸如此类的任何信息或输入吗？

但是我也想通过使用上面显示的预测值（均值，std等）来获得良好的结果。那我该怎么做才能改善预测呢？

Answer 1

以下是开发最佳模型所需遵循的一些步骤：