多标签分类

时间:2019-02-11 15:14:54

标签: pandas dataframe machine-learning keras

我正在使用Keras,scikit-learn等解决多标签分类问题...

我的数据框包含4000个微观油样,带有图像和13个不同的标签,这些样品中发现了问题。

实际上我将所有图像和标签都转换为numpy数组。

一张标签图像的示例:

[0.0,1.0,0.0,0.0,1.0,1.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0]

在此标签中,如果位置等于1,则表示当前样本存在特定问题,例如油中的某些颗粒,如您所见,样本可能有多个输出。

好吧,问题是,我的数据帧不平衡,我需要应用“类权重”方法,但是在查看标签之前,我认为我需要使用以下代码:[0,1,0,0,... ],而不像我上面给出的示例。

详细信息,我可以在没有类权重的情况下运行我的神经网络代码,效果很好,但是我无法使用该不平衡数据来训练所有模型。 已经尝试使用列表,但未成功!

当然,我的形状有问题,例如图像有(1000,100,200,3)和标签(1000,13);那就是为什么我也不能应用班级重量的原因...

我尝试解决一些问题。

我将张贴代码,因为我被卡住了,不知道该怎么办。

class_weight_list = compute_class_weight('balanced',np.unique(Y_train), Y_train) class_weight = dict(zip(np.unique(Y_train), class_weight_list)) Y_train = to_categorical(Y_train,num_classes=len(np.unique(Y_train)))

main.py

dataset.py

models.py

在这种情况下使用标签的最佳策略是什么? 如果有人可以帮助我,我将不胜感激。 在此先感谢!

0 个答案:

没有答案