我有一个递归神经网络来对顺序数据进行分类。
并非所有样本都与预测具有相同的相关性,其他样本一次包含多个类别。例如,单词序列可以是0类和1类。
[1,0,0], [0,1,0] -> [0.5,0.5,0]
因此,我想使用某种多点热编码将类概率融合到我的训练数据中。我觉得这种方法只是在创建新的(按比例缩放)课程,而不是为现有课程提供更好的培训结果。
在使用这些数据作为sample_weights进行训练时,这会导致非常小的类,例如:
这三个类:
第0类:[1.0,0.0,0.0]
第1类:[0.0,1.0,0.0]
第2类:[1.0,0.0,1.0]
成为
第0类:[1.0,0.0,0.0]
第1类:[0.9,0.1,0.0]
..
第9类:[0.0,1.0,0.0]
..
这是有问题的,因为我只想根据样本数对三个类别设置class_weights,而与缩放比例无关。
还:我如何在Keras中做到这一点?