CNN模型为什么数据太大?

时间:2016-12-20 13:05:11

标签: tensorflow keras training-data

the error message

the model structure

  • 使用keras和tensorflow后端
  • 仅使用CPU,内存128GB
  • 输入数据的形状为(45,1024,1024)
  • 模型只有一个卷积,一个(2,2)最大池化
  • 1024 * 1024完全连接。

我收到此错误消息:

  

无效参数:形状[4194304,1048576]太大(超过   1099511627776条目)

请注意:

4194304 = 2048 * 2048
1048576 = 1024 * 1024

keras是如何计算这个形状的?为什么它太大了?

1 个答案:

答案 0 :(得分:0)

形状[4194304, 1048576]的计算方法如下:

将16个大小为[3, 3]same边框模式的卷积应用于大小为[1024, 1024, 3]的输入,为我们提供大小为[1024, 1024, 16]的输出。最大池大小为2后,它变为[512, 512, 16],当展平为512 * 512 * 16 = 4194304时。 1048576来自您1024 * 1024层构造函数中指定的Dense

我认为您应该重新考虑模型的架构。您可以使用较小尺寸的输入,添加多个合并图层,减少应用1 x 1卷积的维度。我怀疑1024 * 1024是完全连接层中合理数量的节点。