我正在使用Tensorflow v1.14创建网络并对其进行培训。一切正常,我对代码没有任何问题。我在损失函数中使用函数tf.reduce_min()
。为了使梯度流动,损耗函数必须可微。但是min
运算符本身是不可微的。该link为tf.reduce_min()
函数提供了必要的解释,但没有参考。
通常,Tensorflow中有一些功能(tf.cond
,tf.where
,以及更多其他功能)在本质上无法通过定义加以区分。我想知道如何通过定义“伪渐变”以及对文档的正确引用来使它们具有差异性。谢谢。