我正在将一组图像和一组地面实况图像转换为LMDB数据库。目的是按像素预测。
用于从RGB图像创建LMDB的大多数代码都有一行指示CxHxW
顺序的转置,如下所示:
im = im.transpose((2,0,1)) # convert to CxHxW
我的图像数据(列车数据和相应的地面实况图像)是灰度级(即单通道)。我的问题是,这一行的目的是什么?我应该为我的single channel
图像和基本事实做这个矩阵转置,还是没有必要?
感谢您的帮助。
答案 0 :(得分:1)
Caffe处理BGR格式的图像而不是RGB。由于ImageNet上的大多数预训练模型都是以BGR格式训练的,因此默认应用此操作(转置)。如果您正在训练灰度图像,则不需要。此外,即使你是从头开始训练RGB图像,也没有必要。