使用多热点编码并使用类权重缩放输出

时间:2018-11-23 16:28:28

标签: python keras lstm recurrent-neural-network one-hot-encoding

我有一个递归神经网络来对顺序数据进行分类。

并非所有样本都与预测具有相同的相关性,其他样本一次包含多个类别。例如,单词序列可以是0类和1类。

[1,0,0], [0,1,0] -> [0.5,0.5,0] 

因此,我想使用某种多点热编码将类概率融合到我的训练数据中。我觉得这种方法只是在创建新的(按比例缩放)课程,而不是为现有课程提供更好的培训结果。

在使用这些数据作为sample_weights进行训练时,这会导致非常小的类,例如:

这三个类: 第0类:[1.0,0.0,0.0] 第1类:[0.0,1.0,0.0] 第2类:[1.0,0.0,1.0]

成为

第0类:[1.0,0.0,0.0] 第1类:[0.9,0.1,0.0] .. 第9类:[0.0,1.0,0.0] ..

这是有问题的,因为我只想根据样本数对三个类别设置class_weights,而与缩放比例无关。

还:我如何在Keras中做到这一点?

0 个答案:

没有答案