我正在以张量流的急切模式训练模型,我需要针对形状不同的多个变量(例如w1和w2)计算梯度。
我知道使用tf.GradientTape()的持久模式,我可以依次对变量进行渐变。但是,我想连接变量并立即执行所有操作:
with tf.GradientTape() as tape:
# build a function of variables w1, w2
loss = f(w1, w2)
grad = tape.gradient(loss, [w1,w2])
当然,上面的代码会引起[w1,w2]的错误,因为它们的形状不兼容。
我想知道如何将不同大小的变量连接起来,以便随后应用渐变?