标签: tensorflow
The doc describes like this:
grad_ys是与ys相同长度的张量列表 ys中每个y的初始渐变。当grad_ys为无时, 我们在ys中为每个y填充y形状的张量。一个 用户可以提供自己的初始grad_ys来计算 对于每个y使用不同初始梯度的导数(例如,如果是 一个人想要对每个中的每个值不同地加权渐变 Y)。
grad_ys
ys
它是什么意思"初始渐变"和"使用不同的初始梯度计算导数"?