在阅读语义分割论文时,有时候我可以阅读像掩码图像的单热标记这样的术语。我不清楚它到底是什么意思?阅读某些实现时,我发现它们的形状通常为rows*columns*2
我的猜测是一个通道对应前景而另一个通道对应背景。是对的吗?此外,我怎么知道哪一个是前景?如果现有训练集仅为rows*columns*1
形状。如何将其转换为此类格式,即rows*columns*2
?我正在做的只是使用newimage[:,:,:,0] = original_image
和newimage[:,:,:,1] = 1-original_image
。但我不确定它是否正确?
答案 0 :(得分:3)
像1,2,3,4,5等分类标签没有任何自然顺序。因此,使用这些数字可能意味着标签5大于标签1,但冰箱和狗只是两个没有自然排序的标签。
因此我们将标签1,2,3,4,5转换为
[1,0,0,0,0],[0,1,0,0,0],...,[0,0,0,0,1]
所以现在他们只是指向某个方向的向量,这使得更容易使用逻辑回归和其他损失函数。
此外,您可以使用行*列* 1
对前景背景进行编码只需将前景值设置为1,将背景设置为0,然后我们就有前景背景蒙版。
我需要查看何时使用行*列* 2的示例,因为它不是常见的,可能会因您看到的位置而异。