我使用带有Tensorflow后端的Keras训练CNN模型。 我希望通过本教程可视化我的CNN过滤器:https://blog.keras.io/how-convolutional-neural-networks-see-the-world.html
from keras import backend as K
from keras.models import load_model
import numpy as np
model = load_model('my_cnn_model.h5')
input_img = np.load('my_picture.npy')
# get the symbolic outputs of each "key" layer (we gave them unique names).
layer_dict = dict([(layer.name, layer) for layer in model.layers])
layer_name = 'block5_conv3'
filter_index = 0 # can be any integer from 0 to 511, as there are 512 filters in that layer
# build a loss function that maximizes the activation
# of the nth filter of the layer considered
layer_output = layer_dict[layer_name].output
loss = K.mean(layer_output[:, :, :, filter_index])
# compute the gradient of the input picture wrt this loss
grads = K.gradients(loss, input_img)[0]
# normalization trick: we normalize the gradient
grads /= (K.sqrt(K.mean(K.square(grads))) + 1e-5)
# this function returns the loss and grads given the input picture
iterate = K.function([input_img], [loss, grads])
但是,当代码执行到此行时:
grads = K.gradients(loss, input_img)[0]
我发现它只返回None
个对象,因此程序在此之后无法继续。
我寻找一些解决方案。有人说input_img
应该是tensorflow的Tensor类型:
https://github.com/keras-team/keras/issues/5455
但是当我试图将img转换为Tensor时,问题仍然存在 我在上面的链接中尝试了解决方案,但仍然失败。
还有人说这个问题存在是因为你的CNN模型不可区分。 https://github.com/keras-team/keras/issues/8478
但我的模型只使用ReLU和Sigmoid的激活功能(在输出层)。 这个问题真的是由不可区分的问题引起的吗?
任何人都可以帮助我吗?非常感谢你!
答案 0 :(得分:5)
如果您有一个Model实例,那么要根据输入获取损失的梯度,您应该这样做:
grads = K.gradients(loss, model.input)[0]
model.input
包含表示模型输入的符号张量。使用普通的numpy数组是没有意义的,因为TensorFlow然后不知道它如何连接到计算图,并返回None作为渐变。
然后你还应该将iterate
函数重写为:
iterate = K.function([model.input], [loss, grads])
答案 1 :(得分:2)
下面是我的例子。希望能帮助别人。
gradient = keras.backend.gradients(model.output, model.input)[2]
iterate = keras.backend.function(model.input, [gradient])
grad = iterate([patches, depthes, poses])
[补丁,深度,姿势]是我的模型。输入
答案 2 :(得分:1)
我也曾经遇到过同样的错误@Jexus。对我来说,问题是:
loss变量是None对象。我用过
loss.assign_add(....)
代替
loss = loss + .....
按上述所述更改后,损失就是返回张量,因此
grads = K.gradients(loss, model.input)[0]
没有返回None。