Keras的Resnet期望什么作为输入?

时间:2017-01-24 07:03:38

标签: python neural-network deep-learning theano keras

我正在尝试将Keras的resnet实现用于具有完全不同的图像集(B& W 16位)的传输搜索任务。那么Keras期望作为一种投入?具有3个通道和-127-128范围的图像(这是我假设零中心8位图像)? 0-255?如果我超出这个范围,会发生什么?

感谢。

1 个答案:

答案 0 :(得分:2)

根据Keras文档中提供的paper,您应提供224 x 224 RGB [0 - 225]图片。实际的维度排序取决于您在Keras安装中使用的后端。

AlexNet中那样进行数据准备,从而从每个颜色通道中减去平均激活。 RGB的平均向量是103.939, 116.779, 123.68

如果您的颜色值会延长-255, 255范围 - 由于网络未知的数据量,它可能会损害您的培训。但仍然 - 网络可以适应这种变化,但它通常会腾出更多时间,使训练更加混乱。

在单色图像的情况下 - 常用的技术是重复相同的通道3次,以使尺寸合理用于网络架构。