如果我们可以单人管理,为什么我们要扩大维度?

时间:2018-10-24 09:49:11

标签: tensorflow deep-learning conv-neural-network

对于图像,我观察到我们正在创建一个具有相同数量尺寸的模型,但是我们可以选择将其从3变为1的灰色显示。例如:-如果我们有一个尺寸为彩色(带有RGB)的彩色图像28x28x3 ,就像我们输入模型的输入一样。对于相同的图像,如果我们使用rgb2gray方法将其转换为灰色,则会将其尺寸从28x28x3转换为28x28。为什么我们不总是将这种灰色图像提供给我们的模型?

2 个答案:

答案 0 :(得分:0)

该方法取决于您要尝试执行的操作。在某些情况下,图像中需要3个通道才能获得更高的精度。由于颜色也是信息,因此将所有通道粉碎为一个通道会泄露很多有时有用的信息。通常在问题识别,分割,分类等问题上保留3个通道。另一方面,灰度级通常用于文档处理,HTR,OCR等。

另一件事:在Tensorflow中,您需要最后一个尺寸,因此,如果您要使用灰度图像,则必须将其塑造为28x28x1。假设您使用的是OpenCv,则必须在重新将图像输入网络之前对其进行重塑。

请记住,如果模型是用灰色图像训练的,那么它将不能使用彩色图像进行预测!

我希望它能帮助

答案 1 :(得分:0)

当然这取决于您要做什么...

如果您想训练一个模型来区分“格兰尼史密斯”(绿色)和“粉红女士”(红色)苹果,则使用灰度图像不是很有帮助。

如果您想训练一个模型来区分苹果和香蕉,则灰度图像就足够了。