计算预测连续值的准确度分数

时间:2018-03-05 03:36:47

标签: python scikit-learn sklearn-pandas

来自sklearn.metrics import accuracy_score

accuracy_score(y_true,y_pred)

我相信这段代码会返回我们预测的准确性。但是,我正在比较连续值的预测值和实际值,我相信它们中的大多数都不会完全相同。

我是否应该拟合测试集值并绘制预测值以获得R平方?

有人可以告诉我如何在连续变量的情况下测量预测的准确性吗?

1 个答案:

答案 0 :(得分:5)

在机器学习中,为离散值(类)定义精度。它被定义为从总预测中得出的正确预测的分数。

因此,值319的预测(其中真值为320)仍然是不正确的预测。

因此,不建议计算连续值的准确度。对于此类值,您可能需要计算预测值与真实值的接近程度。这种预测连续值的任务称为回归。通常,R平方值用于衡量模型的性能。

您可以将r2_score(y_true, y_pred)用于您的方案。

回归任务(连续变量预测)有各种指标,如: -

  • 均方误差,
  • 平均绝对误差,
  • 方差分数等

您可以获得有关这些指标here的sklearn实施的更多信息。