标签: python tensorflow
当我通过@tf.custom_gradient使用自定义渐变时,grad lambda似乎不会运行,除非会话运行调用实际需要它。如果我在自定义后向传递调用期间尝试更新tf.GraphKeys.UPDATE_OPS,大概是行为未定义。基于中间梯度添加累加器运算的最佳方法是什么?这些不能预先添加,因为它们仅在最小调用之后存在。任何一般性建议或想法都将不胜感激!
@tf.custom_gradient
grad
tf.GraphKeys.UPDATE_OPS
我正在使用python。