TF / Keras稀疏分类交叉熵

时间:2019-08-11 12:54:39

标签: tensorflow machine-learning keras

我有一些数据被松散地标记为一个“重要性”类别。 基本上,标签为[0..5],并且具有相同的含义-它们仅以不同的突出度表示同一事件。 想象一个阳光明媚的海滩?,您的数据是波浪在沙滩上滚动的力(或另一种解释-每个波浪行进到海滩边缘的距离,分为5个容器/类)。

我的问题-如果我使用稀疏分类交叉熵来预测波浪类别,那么TF / Keras模型能否“理解” 5比4大(更好/更有用),而4比3大等。

是否可以推断标签值之间相互关联?标签1 2 3 4 5的顺序与5 4 3 2 1吗?

数据支持上述事实,但模型会解决吗?我该怎么做才能使模型更容易?

或者换句话说,从解释分类标签值的意义上来说,稀疏分类交叉熵的内在实现是什么?

1 个答案:

答案 0 :(得分:1)

这是一个非常好的问题。这是我对您的问题的直觉。稀疏的分类交叉熵将每个类别威胁为不同的类别。因此,假设标签为1,在[0,1,0,0,0,0]的{​​{1}}和3的{​​{1}}之间没有连接。另一方面,标签表示单个事件的大小,其中[0,0,1,0,0,0]是最大值,[0,1,2,3,4,5]是最小值。因此,我将您的标签标准化为:

5

,然后计算单个事件的S形交叉熵,其中0表示最高概率,labels = labels / max(labels) 表示最低概率。从这个意义上讲,您的标签应在以下范围1.0中。您可以通过以下方式做到这一点:

0.0