我有一些数据被松散地标记为一个“重要性”类别。 基本上,标签为[0..5],并且具有相同的含义-它们仅以不同的突出度表示同一事件。 想象一个阳光明媚的海滩?,您的数据是波浪在沙滩上滚动的力(或另一种解释-每个波浪行进到海滩边缘的距离,分为5个容器/类)。
我的问题-如果我使用稀疏分类交叉熵来预测波浪类别,那么TF / Keras模型能否“理解” 5比4大(更好/更有用),而4比3大等。
是否可以推断标签值之间相互关联?标签1 2 3 4 5的顺序与5 4 3 2 1吗?
数据支持上述事实,但模型会解决吗?我该怎么做才能使模型更容易?
或者换句话说,从解释分类标签值的意义上来说,稀疏分类交叉熵的内在实现是什么?
答案 0 :(得分:1)
这是一个非常好的问题。这是我对您的问题的直觉。稀疏的分类交叉熵将每个类别威胁为不同的类别。因此,假设标签为1
,在[0,1,0,0,0,0]
的{{1}}和3
的{{1}}之间没有连接。另一方面,标签表示单个事件的大小,其中[0,0,1,0,0,0]
是最大值,[0,1,2,3,4,5]
是最小值。因此,我将您的标签标准化为:
5
,然后计算单个事件的S形交叉熵,其中0
表示最高概率,labels = labels / max(labels)
表示最低概率。从这个意义上讲,您的标签应在以下范围1.0
中。您可以通过以下方式做到这一点:
0.0