Question

我有一种机器学习方法，可以计算jpeg图像中的汽车。对于每幅图像，我都有一个通过机器学习方法预测的汽车数量，以及一个基于人员数量的真实汽车数量的实际计数。这是数据集的样子：

             predicted_cars   real_cars
Image_1      2                1
Image_2      6                7
Image_3      0                0
Image_4      0                1
Image_5      0                0
Image_6      1                1
...
Image_5000   4                3

我最初的想法是使用线性回归，尽管由于该数据集具有离散计数数据，所以我认为这是不合适的。另外，由于大多数计数可能为0，因此这可能会影响统计数据。

我可以采用哪种方法以统计和/或图形方式评估预测的汽车数量与“真实”汽车数量的比较？我正在使用scikit-learn和pandas在Python中工作。

Answer 1

在这里计算结果的准确性非常简单，您可以以mean absolute error或mean squared error为例。您可以在sklearn.metrics中找到各种各样的错误指标。

为直观表示结果，一种方法是绘制堆积的条形图：

child: StreamBuilder<String>(
        stream: isThisRequired?translationsBloc.languageOutStream:themeBloc.outFirestore,

Answer 2

为获得准确性，请选择一个得分指标，例如： https://scikit-learn.org/stable/modules/generated/sklearn.metrics.mean_squared_error.html#sklearn.metrics.mean_squared_error

如何比较预测数据与实际数据？

2 个答案: