应用错误收集

时间：2018-05-22 19:25:22

标签： tensorflow computer-vision

我有给定场景的RGB-D（彩色和深度）图像。我想使用张量流来训练基于预先训练的网络的分类模型，例如开始。据我所知，这些预先训练的模型是使用3通道RGB图像构建的。但是，无法处理第4频道的包含。

如何直接使用RGB-D图像？我是否需要预处理图像，并分离RGB和D，如果是这样，我如何单独使用D（1通道）？

谢谢！

答案 0 :(得分：2)

如果您想使用预先训练过的模型，您只能使用RGB，因为它们只是经过训练才能理解RGB。在这种情况下，正如你所说：将它们分开并丢弃深度。

要使用这样的4通道图像，您需要从头开始重新训练网络，而不是加载预先训练过的权重集。

您可能会使用与3通道图像相同的架构获得良好的效果（除了支持4通道输入所需的微小更改），因此重新训练不应该非常困难。