如何衡量数据集的准确性

时间:2019-07-26 09:54:55

标签: python tensorflow keras

如何测量数据集的准确性。我认为,通过机器学习和深度学习模型获得的准确性是模型的准确性,而不是数据集

2 个答案:

答案 0 :(得分:0)

我不太确定您所说的“数据集准确性”是什么。没错,精度函数不是评估模型性能的最佳方法。 Scikit Learn,尤其是Metrics提供了一些有用的功能。 Roc分析是一个很好的关键。也许这就是您想要的。

答案 1 :(得分:0)

根据我对“数据集准确性”一词的理解,您所指的是某种度量标准,它将告诉您可以信任数据集的程度。没错,从ML和DL获得的精度就是模型精度。毕竟,您正在检查模型对先前知道正确答案的先前未知数据的反应。

这应该是数据获取的一部分,而不是ML过程的一部分。您必须根据获取数据的方法来计算或估计数据的不确定性,这本身可能会带来中等到困难的挑战。完成此操作后,您将知道数据的准确性。

请始终记住,您的模型只是现实的近似。您的模型基于提供的数据-如果数据有缺陷,该模型怎么知道?

总结起来:从您教给模型的信息中无法获得数据集的准确性。在开始训练的那一刻,您已经隐含地同意信任您的数据足以对现实进行建模。