用于语义分割的单热标签

时间:2016-11-03 04:09:06

标签: opencv computer-vision tensorflow deep-learning caffe

在阅读语义分割论文时,有时候我可以阅读像掩码图像的单热标记这样的术语。我不清楚它到底是什么意思?阅读某些实现时,我发现它们的形状通常为rows*columns*2

我的猜测是一个通道对应前景而另一个通道对应背景。是对的吗?此外,我怎么知道哪一个是前景?如果现有训练集仅为rows*columns*1形状。如何将其转换为此类格式,即rows*columns*2?我正在做的只是使用newimage[:,:,:,0] = original_imagenewimage[:,:,:,1] = 1-original_image。但我不确定它是否正确?

1 个答案:

答案 0 :(得分:3)

像1,2,3,4,5等分类标签没有任何自然顺序。因此,使用这些数字可能意味着标签5大于标签1,但冰箱和狗只是两个没有自然排序的标签。

因此我们将标签1,2,3,4,5转换为

[1,0,0,0,0],[0,1,0,0,0],...,[0,0,0,0,1]

所以现在他们只是指向某个方向的向量,这使得更容易使用逻辑回归和其他损失函数。

此外,您可以使用行*列* 1

对前景背景进行编码

只需将前景值设置为1,将背景设置为0,然后我们就有前景背景蒙版。

我需要查看何时使用行*列* 2的示例,因为它不是常见的,可能会因您看到的位置而异。