我正在tensorflow上使用带有python 3和keras的ubuntu,我正尝试使用从预先训练的keras模型中进行转移学习来创建模型,如here所述:
我正在使用以下代码
import numpy as np
from keras.applications import vgg16, inception_v3, resnet50, mobilenet
from keras import Model
a = np.random.rand(1, 224, 224, 3) + 0.001
a = mobilenet.preprocess_input(a)
mobilenet_model = mobilenet.MobileNet(weights='imagenet')
mobilenet_model.summary()
inputLayer = mobilenet_model.input
m = Model(input=inputLayer, outputs=mobilenet_model.get_layer("conv_pw_13_relu")(inputLayer))
m.set_weights(mobilenet_model.get_weights()[:len(m.get_weights())])
p = m.predict(a)
print(np.std(p), np.mean(p))
print(p.shape)
我正在使用的图层的输出始终是零数组,是否应该将权重加载到我正在创建的p上,以使预先训练的模型真正起作用?
答案 0 :(得分:2)
各层与这些层的输出之间的Keras有所不同。您可以将图层视为代表计算,将输出视为这些计算的结果。当实例化一个Model
对象时,它期望计算的结果作为输出,而不是计算本身,因此是错误。要对其进行修复,可以将图层的输出传递给Model
构造函数:
import numpy as np
from keras.applications import vgg16, inception_v3, resnet50, mobilenet
from keras import Model
a = np.random.rand(24, 224, 224, 3)
a = mobilenet.preprocess_input(a)
mobilenet_model = mobilenet.MobileNet(weights='imagenet')
mobilenet_model.summary()
model_output = mobilenet_model.get_layer("conv_pw_13_relu").output
m = Model(inputs=mobilenet_model.input, outputs=model_output)
print(m.predict(a))
答案 1 :(得分:1)
为了访问Keras模型中中间层的输出,Keras提供了不同的方法。
根据您的情况,您可以像这样获取所需图层的输出
model_out = mobilenet_model.get_layer("layer_you_want").output
m = Model(input=inputLayer, outputs=model_out)
有关此方法和其他可用方法的更多详细信息,请查看this文档