我所代表的图像尺寸为100px x 100px,因此我可以使用形状(None, 100, 100, 3)
或形状(None, 10000, 3)
我在Google上找不到任何明确的解释,但是,以下两个张量会导致相似的结果吗?
(None, 100, 100, 3)
(None, 10000, 3)
我认为这两种方法都足够,因为我想如果图像在一行中,神经网络仍会学习得一样好,
答案 0 :(得分:0)
对于第一种形状:( 100 , 100 , 3 )
这是3维张量。如果使用密集层,则它们需要二维输入。是的,虽然存在一维卷积层,但它们保留用于完全不同的用例。
卷积层将使内核经过确定的步幅,并将收集空间信息。然后将对该内核进行合并,以便保留信息,但尺寸较小。
因此,具有这种形状的学习会比学习好得多 空间特征将发生。这非常适合图像 分类。
对于第二种形状:( 10000 , 3 )
这是二维张量,适用于1D卷积层和密集层。
一维卷积仅使内核通过一条直线(轴)。图像的特征也将以直线对齐(所有列将对齐)。这将破坏图像的功能。
因此,图像最终是2D对象a,并且必须保持其原始尺寸以方便学习。一维张量还有其他用途,例如文本分类,人类活动识别等。