Question

我有一些数据被松散地标记为一个“重要性”类别。基本上，标签为[0..5]，并且具有相同的含义-它们仅以不同的突出度表示同一事件。想象一个阳光明媚的海滩?，您的数据是波浪在沙滩上滚动的力（或另一种解释-每个波浪行进到海滩边缘的距离，分为5个容器/类）。

我的问题-如果我使用稀疏分类交叉熵来预测波浪类别，那么TF / Keras模型能否“理解” 5比4大（更好/更有用），而4比3大等。

是否可以推断标签值之间相互关联？标签1 2 3 4 5的顺序与5 4 3 2 1吗？

数据支持上述事实，但模型会解决吗？我该怎么做才能使模型更容易？

或者换句话说，从解释分类标签值的意义上来说，稀疏分类交叉熵的内在实现是什么？

Answer 1

这是一个非常好的问题。这是我对您的问题的直觉。稀疏的分类交叉熵将每个类别威胁为不同的类别。因此，假设标签为1，在[0,1,0,0,0,0]的{{1}}和3的{{1}}之间没有连接。另一方面，标签表示单个事件的大小，其中[0,0,1,0,0,0]是最大值，[0,1,2,3,4,5]是最小值。因此，我将您的标签标准化为：

，然后计算单个事件的S形交叉熵，其中0表示最高概率，labels = labels / max(labels)表示最低概率。从这个意义上讲，您的标签应在以下范围1.0中。您可以通过以下方式做到这一点：

0.0

TF / Keras稀疏分类交叉熵

1 个答案: