混淆矩阵准确性评估非等长用户和生产者数据集

时间:2018-08-31 17:38:23

标签: python pandas classification confusion-matrix

我正在尝试执行以下分类评估:enter image description here

我的问题是我的分类具有超过3000000个分类像素,而我的训练数据集只有大约30-40(每个类别可以说10-15)。

我的数据集都具有如下相同的布局:

  

训练行示例= [[230,40,120,2]],前三个值   是像素色带(BGR),最后声明   输出类(我们可以1-3)。

我正在将训练数据作为csv文件读取并转换为熊猫数据框。

问题:即使我在两个数据集中具有不同数量的预测和实际数据值,也可以使用此方法吗?如果是这样,则不确定第9至13行用于什么。

代码:

b,g,r = cv2.split(img)
# Pandas dataset
dataSet = pd.DataFrame({'bBnad':b.flat[:],'gBnad':g.flat[:],'rBnad':r.flat[:]})
dataSet['class'] = X_clustered
training = pd.read_csv("/Users/chrisradford/Documents/School/Masters/RA/Classifier/Python/Training.csv")

0 个答案:

没有答案