应用错误收集

需要时，TensorFlow中的自动微分程序是否计算次梯度？如果有很多次梯度，那么将选择哪个作为输出？

我正在尝试在链接https://www.aclweb.org/anthology/P13-1045中实现该论文，该链接使用递归神经网络来执行有效的语言解析。目标函数使用铰链损失函数来选择最佳输出向量，这使函数不可微。我在急切的模式下使用TensorFlow（v1.12）对该模型进行编程，并使用自动微分计算梯度。每一批之后，我可以看到梯度值发生了变化，并且精度有所提高。片刻之后，它减少并且该过程继续。对于所有超参数配置，该模型根本不会收敛。

最小批量大小：256、512、1024;正则化参数-0.1、0.01、0.001;学习率-0.1，0.01，0.001;优化功能-梯度下降，阿达格勒，亚当;

在本文中，他们以非常抽象的方式描述了如何找到最佳函数的次梯度，这我还没有理解。一开始，我认为自动梯度计算会计算次梯度。但此刻，我开始怀疑，因为这似乎是唯一缺少的变量。

如何计算TensorFlow中的次梯度？

1 个答案: