使用训练数据进行Python图像分类准确性评估

时间:2018-09-01 15:52:13

标签: python pandas classification confusion-matrix

我对图像进行了分类,并将其相应的像素数据输出为数据集。我也有相同类型的数据集,其中样本数量不一致,称为训练数据。我希望使用用户创建的训练数据集再次对分类的像素数据进行准确性评估。我尝试使用python脾脏confusion_matrixaccuracy_score,但是我的问题是两个数据集(生产者,用户)的大小不同。我可以执行准确性评估以检查结果吗?

这是两个数据集,包括它们的大小

enter image description here

代码:

user = pd.read_csv("/Users/chrisradford/Documents/School/Masters/RA/Classifier/Python/Training.csv")
producer = pd.read_csv("/Users/chrisradford/Documents/School/Masters/RA/Classifier/Python/ProducerData.csv")
print("User created training data")
print(user.shape)
print(user.head())
print("producer created data")
print(producer.shape)
print(producer.head())
val = accuracy_score(user, producer)
cnf_matrix = confusion_matrix(producer, user)
print(val)
print(cnf_matrix)

1 个答案:

答案 0 :(得分:0)

据我所知,我发现评估图像分类准确性的最佳方法是进行K折交叉验证。可以选择任意K值进行交叉验证,但是我更希望使用10的值来确保对测试数据的评估没有偏倚且完全随机。因此,当您计算每个Kth折叠的交叉验证时,最终会得到4个值的假阳性,假阴性,真阳性和真阴性。之后,可以通过取每个值的平均值来构建混淆矩阵。