神经网络训练用面罩

时间:2020-06-29 18:34:02

标签: python machine-learning computer-vision pytorch multilabel-classification

我正在训练一个神经网络,我发现了由无人机拍摄的照片数据集。它说它有20个类别应被检测。但是所有的蒙版都像这样(对不起,图像真的很暗!): This is my mask

当我尝试训练网络时,总是说图像只有3个通道。 (我认为这可能是RGB)。问题是我的网络希望遮罩有20个通道的输入(每个类别一个都可以检测到,例如树木,汽车,人等)。我是否可以将图像转换为20个通道的图像?我看了看一下蒙版是否只有20种不同的像素颜色值,但它有254种,所以我认为这与...无关。

谢谢! (这是我关于StackOverflow的第一个问题,所以如果有问题,请告诉我!:-))

1 个答案:

答案 0 :(得分:1)

我不确定我是否正确理解了您的问题,但是是的,有一种方法可以对图像进行升采样以使其成为20通道输入。您要做的就是获取原始图像(假设其大小为[batch, height, width, #channels]),然后将其与内核([#channels, height, width, 20])进行卷积,同时保持填充模式为“相同”。这样会将您的3通道图像转换为20通道阵列(不再称为图像)。