我想了解tf.nn.sparse_softmax_cross_entropy_with_logits
的工作原理。
描述说:
A common use case is to have logits of shape [batch_size, num_classes]
and labels of shape [batch_size]. But higher dimensions are supported.
因此它表明我们可以以原始形式提供标签,例如[1,2,3]
。
现在,由于所有计算都是按批次完成的,我相信以下内容是可能的:
在所有情况下,我们假设批次大小等于2。
案例1(一批): 分对数:
0.4 0.2 0.4
0.3 0.3 0.4
对应标签:
2
3
我猜测标签可能被编码为
[1 0 0]
[0 1 0]
案例2(另一批): 分对数:
0.4 0.2 0.4
0.3 0.3 0.4
对应标签:
1
2
我猜测标签可能被编码为(我不知道是什么阻止了我们编码,除非张量流跟踪它之前的编码方式)
[1 0 0]
[0 1 0]
所以我们有两种不同的编码。假设tensorflow在批处理之间保持编码一致是否安全?
答案 0 :(得分:3)
没有真正的编码发生。标签只是相应单热矢量中1
的位置:
0 -> [1, 0, 0]
1 -> [0, 1, 0]
2 -> [0, 0, 1]
这个“编码”将在每批中使用。