机器学习Keras精度模型与精度新数据预测

时间:2018-12-18 12:22:54

标签: r model keras prediction

我使用keras进行了深度学习。模型的准确性为99%。

    $`loss`
[1] 0.03411416

$acc
[1] 0.9952607

当我使用模型在新数据文件上进行预测类别时,只有87%的类别分类正确。我的问题是,为什么模型准确性和模型预测得分之间会有差异?

1 个答案:

答案 0 :(得分:1)

您的99%位于训练集上,这表明自己在训练过程中正在执行算法,永远不要把它当作参考。

您应该始终查看测试集,这才是真正的价值。

更重要的是,您的准确度应始终如下所示(至少是样式):

例如训练集准确性始终在增长,而测试集遵循相同的趋势,但低于训练曲线。

enter image description here

您永远永远不会拥有完全相同的两组(培训和测试/验证),因此正常会有所不同。

培训集的目标是概括数据并从中学习。

测试集的目的是查看您是否概括良好

如果您距离训练集太远,则两个集之间有很大的差异(主要是分布,数据类型等),或者如果两者相似,则您的模型过拟合(这意味着您的模型是太接近您的训练数据,并且如果您的测试数据有一点差异,这将导致错误的预测。

模型过拟合的原因通常是您的模型过于复杂,因此您必须简化模型(例如,减少层数,减少神经元数量等)