在两个特征子集上比较神经网络的结果

时间:2019-05-26 02:09:50

标签: python neural-network lstm data-science feature-extraction

我正在对具有24个要素的多元时间序列数据集运行LSTM模型。我使用几种不同的方法(方差测试,随机森林提取和Extra Tree Classifier)进行了特征提取。不同的方法产生的特征子集略有不同。现在,我想在所有子集上测试我的LSTM模型,以查看哪种模型可以提供最佳结果。

我的问题是我的3个模型的测试/训练RMSE分数都非常相似,并且每次运行模型时,我都会得到略有不同的答案。这个问题来自一个天真的人,仍然在学习神经网络的复杂性,所以请帮助我理解:在这种情况下,如何确定最佳模型?可以为神经网络播种吗?还是在一定数量的试验中求平均值?

1 个答案:

答案 0 :(得分:1)

由于您已经提到使用不同的特征提取方法,因此您得到的特征集仅略有不同,因此结果也相似。同样,由于您的LSTM模型也将获得几乎相似的RMSE值,因此这些模型能够很好地泛化并进行相似的学习,并从所有数据集中提取重要信息。

最佳模型取决于您的未来数据,不同方法的计算时间和负载以及它们在生产中的持续效果。在神经网络中,设置种子并不是一个好主意。基本思想是,无论模型如何开始,模型都应能够达到最佳权重。如果您的模型总是得到相似的结果,那么在大多数情况下,这是一件好事。