如何比较预测数据与实际数据?

时间:2019-04-16 14:11:11

标签: python pandas scikit-learn statistics frequency

我有一种机器学习方法,可以计算jpeg图像中的汽车。对于每幅图像,我都有一个通过机器学习方法预测的汽车数量,以及一个基于人员数量的真实汽车数量的实际计数。这是数据集的样子:

             predicted_cars   real_cars
Image_1      2                1
Image_2      6                7
Image_3      0                0
Image_4      0                1
Image_5      0                0
Image_6      1                1
...
Image_5000   4                3

我最初的想法是使用线性回归,尽管由于该数据集具有离散计数数据,所以我认为这是不合适的。另外,由于大多数计数可能为0,因此这可能会影响统计数据。

我可以采用哪种方法以统计和/或图形方式评估预测的汽车数量与“真实”汽车数量的比较?我正在使用scikit-learn和pandas在Python中工作。

2 个答案:

答案 0 :(得分:1)

在这里计算结果的准确性非常简单,您可以以mean absolute errormean squared error为例。您可以在sklearn.metrics中找到各种各样的错误指标。

为直观表示结果,一种方法是绘制堆积的条形图:

child: StreamBuilder<String>(
        stream: isThisRequired?translationsBloc.languageOutStream:themeBloc.outFirestore,

enter image description here

答案 1 :(得分:0)