我的问题是我的分类具有超过3000000个分类像素,而我的训练数据集只有大约30-40(每个类别可以说10-15)。
我的数据集都具有如下相同的布局:
训练行示例= [[230,40,120,2]],前三个值 是像素色带(BGR),最后声明 输出类(我们可以1-3)。
我正在将训练数据作为csv文件读取并转换为熊猫数据框。
问题:即使我在两个数据集中具有不同数量的预测和实际数据值,也可以使用此方法吗?如果是这样,则不确定第9至13行用于什么。
代码:
b,g,r = cv2.split(img)
# Pandas dataset
dataSet = pd.DataFrame({'bBnad':b.flat[:],'gBnad':g.flat[:],'rBnad':r.flat[:]})
dataSet['class'] = X_clustered
training = pd.read_csv("/Users/chrisradford/Documents/School/Masters/RA/Classifier/Python/Training.csv")