应用错误收集

TensorFlow RandomForest vs深度学习

时间：2017-07-06 03:16:51

标签： python machine-learning tensorflow neural-network random-forest

我使用TensorFlow作为训练模型，其中4个输入有1个输出。问题在于回归。

我发现当我使用RandomForest训练模型时，它会快速收敛并在测试数据上运行良好。但是当我使用简单的神经网络来解决同样的问题时，损失（随机平方误差）并不会收敛。它会卡在特定的值上。

我尝试增加/减少隐藏层数，增加/减少学习率。我还尝试了多个优化器，并尝试在标准化和非标准化数据上训练模型。

我是这个领域的新手，但到目前为止，我所阅读的文献都强烈地断言，神经网络应该比随机森林更有效和明确地工作。

在这种情况下，模型不收敛的原因是什么？

2 个答案:

答案 0 :(得分：1)

如果您的模型没有收敛，则表示优化程序在您的损失函数中卡在局部最小值中。
我不知道你正在使用什么样的优化器，但尝试稍微增加动量甚至学习率。通常采用的另一种策略是学习率衰减，这会使您的学习率每几个时期减少一个因素。这也可以帮助您在训练阶段早期陷入局部最小值，同时在训练结束时达到最高准确度。

否则，您可以尝试选择适合您的超参数选择的自适应优化器（adam，adagrad，adadelta等）。

This是一个比较不同优化技术的非常好的帖子。

深度神经网络需要大量数据才能充分发挥作用。确保您拥有很多的培训数据，否则您的模型会过度适合。

答案 1 :(得分：0)

开始训练模型的一个有用规则，不是从更复杂的方法开始，例如，线性模型，您将能够更容易地理解和调试。

如果你继续使用当前的方法，一些想法：

检查初始重量值（使用正态分布初始化它们）
正如前一张海报所说，降低了学习率
对数据进行一些额外检查，检查NAN和异常值，当前模型可能对噪声更敏感。记住，垃圾进去，垃圾出来。