我有给定场景的RGB-D(彩色和深度)图像。我想使用张量流来训练基于预先训练的网络的分类模型,例如开始。据我所知,这些预先训练的模型是使用3通道RGB图像构建的。但是,无法处理第4频道的包含。
如何直接使用RGB-D图像?我是否需要预处理图像,并分离RGB和D,如果是这样,我如何单独使用D(1通道)?
谢谢!
答案 0 :(得分:2)
如果您想使用预先训练过的模型,您只能使用RGB,因为它们只是经过训练才能理解RGB。在这种情况下,正如你所说:将它们分开并丢弃深度。
要使用这样的4通道图像,您需要从头开始重新训练网络,而不是加载预先训练过的权重集。
您可能会使用与3通道图像相同的架构获得良好的效果(除了支持4通道输入所需的微小更改),因此重新训练不应该非常困难。