算法我正在尝试实现数据集中类不平衡的处理。我有40类CelebA数据集,这是一个多标签数据集,并希望动态地平衡该数据集。我正在使用keras,但无法提出正确的逻辑来解决问题。
算法
问题
请让我知道在Keras中解决上述算法最有效的方法是什么。要获得更多帮助,您可以在此处查看研究论文:https://www.cs.umd.edu/~emhand/Papers/AAAI2018_SelectiveLearning.pdf?fbclid=IwAR13MMtV4TpVSerMZqgmt_t1-8VhD-XUQYJ4qORjXz-mbMDv1W7JqgwrSN8
算法在第3页的批量平衡标题下说明。
答案 0 :(得分:0)
您可以像下面这样使用类权重:
model.fit(X_train, y_train, class_weight=class_weights)
其中class_weights是字典。例如,class_weights = {0:4,4,1:10,2:1},这意味着对于类别0的每4个样本,我们在类别1中有10个样本,在类别2中有1个样本。
在您的特定示例中,您可能只为感兴趣的正负类设置了适当的参数。