我有将近26万个特征的60万行数据。在验证集上训练神经网络进行分类和准确性的过程从99到25。在某些时期达到99,而在下一时期本身有时降到25。这可能是其原因。
答案 0 :(得分:0)
即使您的回答很广泛,这也可能对您有所帮助。我在StackExchange上找到了一个很好的答案。
查看this的答案,我认为这可能是发生的,因为验证数据点的某些部分只是随机分类的。具有26个不同的特征可能是一个很大的缺点->分类器可能无法找到模式,因为某些特征太吵杂,不够精确甚至抵消了您的目的,最终导致了随机分类。
另一个可能的问题是您的学习速度。如果它太低,您可能会错过损失景观上的好地方。因此,取决于您的运气好坏。
我的建议是做一些数据科学,以找出对结果影响最大的特征。看看this的中篇文章,找到一些好的技术。而且,如果这不能带您到任何地方,请尝试一些正则化技术并选择合适的学习率。
如果没有任何效果,请让我们对您的数据集有更深入的了解,并提供培训的详细信息。