用于该问题的数据拟合模型

时间:2019-05-10 21:09:09

标签: matlab machine-learning data-science prediction data-fitting

我的数据集包含15个独立变量和2个预测变量或响应。问题是要找到输入和输出变量之间的映射。基本上,给定一个特征向量作为输入,训练后的模型将给出响应的估计值或预测值。我的输入数据包括化学浓度,农作物的产量,降雨百分率等,使用此输入,模型应该能够预测土壤的酸度和温度。数据是在一年中收集的。

在训练期间,模型应该能够准确地复制响应。然后,经过训练的模型应该能够在给定一天的输入特征的情况下输出一天的响应。

我已拆分数据-我用于培训的数据占70%,用于测试的数据占30%。我的想法是使用LSTM Matlab document。可以使用LSTM还是为此任务提供更好的模型?

我的困惑是,在所有文档中,LSTM都用于预测未来的某个时间。但是我的问题倾向于使数据适合功能。我曾尝试使用回归,但准确性非常差。请提出其他适合此问题的方法。

1 个答案:

答案 0 :(得分:0)

对于您的问题,LSTM似乎有些过大。如果您相信 current ph和温度可以由 current 浓度,产率等完全解释,那么您确实只需要拟合一个简单的回归(不必是线性的) ),而不是像LSTM这样的时间序列模型。

在转向神经网络之前,我建议尝试: -具有非线性(例如多项式或样条)特征的线性回归 -树木合奏:随机森林和梯度增强

神经网络在特征提取方面非常出色,但是如果您已经拥有结构良好的特征,那么比简单的模型类型可能是更好的选择。