我想计算TensorFlow.js中相对于输入向量的损耗梯度。
这是我尝试过的:
function f(img) {
return tf.metrics.categoricalCrossentropy(model.predict(img), lbl);
// (Typo: the order of arguments should be flipped, but it does not affect the question here)
}
var g = tf.grad(f);
g(img).print();
img
是形状为[1,784]的张量。 lbl
是形状为[1,10]的张量。 model
是经过tf.Sequential
训练的香草MNIST DNN。
对g(img)
的调用因堆栈跟踪而失败:
Uncaught TypeError: Cannot read property 'shape' of undefined
at gradFunc (Concat_grad.js:29)
at Object.s.gradient (engine.js:931)
at a (tape.js:158)
at tape.js:136
at engine.js:1038
at engine.js:433
at e.t.scopedRun (engine.js:444)
at e.t.tidy (engine.js:431)
at e.t.gradients (engine.js:1033)
at gradients.js:69
我想念什么?
答案 0 :(得分:1)
我的原始代码段正确; TensorFlow.js的2.6.0和2.5.0版本中有一个tf.grad
bug导致了此错误。
该代码按2.4.0或新版本2.7.0中的预期工作。
答案 1 :(得分:0)
通过将model.predict
排除在f
范围之外,tf.grad
将起作用。
function f(img) {
return tf.metrics.categoricalCrossentropy(img, lbl);
}
var g = tf.grad(f);
const output = model.predict(img);
g(output).print();
版本2.7 +
中已修复的顺序模型似乎有错误