图像张量的形状会影响结果输出吗?

时间:2019-03-21 00:44:39

标签: tensorflow machine-learning neural-network

我所代表的图像尺寸为100px x 100px,因此我可以使用形状(None, 100, 100, 3)或形状(None, 10000, 3)

我在Google上找不到任何明确的解释,但是,以下两个张量会导致相似的结果吗?

  1. (None, 100, 100, 3)
  2. (None, 10000, 3)

我认为这两种方法都足够,因为我想如果图像在一行中,神经网络仍会学习得一样好,

1 个答案:

答案 0 :(得分:0)

对于第一种形状:( 100 , 100 , 3 )

这是3维张量。如果使用密集层,则它们需要二维输入。是的,虽然存在一维卷积层,但它们保留用于完全不同的用例。

卷积层将使内核经过确定的步幅,并将收集空间信息。然后将对该内核进行合并,以便保留信息,但尺寸较小。

  因此,具有这种形状的学习会比学习好得多   空间特征将发生。这非常适合图像   分类。

对于第二种形状:( 10000 , 3 )

这是二维张量,适用于1D卷积层和密集层。

一维卷积仅使内核通过一条直线(轴)。图像的特征也将以直线对齐(所有列将对齐)。这将破坏图像的功能。

  

因此,图像最终是2D对象a,并且必须保持其原始尺寸以方便学习。一维张量还有其他用途,例如文本分类,人类活动识别等。