应用错误收集

1.4f seq2seq教程中的采样丢失

时间：2017-11-23 16:14:09

标签： tensorflow recurrent-neural-network softmax

任何人都可以告诉我，为什么在https://github.com/tensorflow/nmt/tree/tf-1.4的tf 1.4的seq2seq教程中他们没有使用抽样的softmax损失？在他们的模型中，他们有40000个词条的词汇量，只使用减少的Arrays.sort总和来获得他们的训练损失..

1 个答案:

答案 0 :(得分：1)

在我看来，采样softmax只适用于训练，当张量流知道哪些类是负数并且它不计算所有类的损失但很少采样负类和正类。对于NMT，我们希望最终得到预测，在这种情况下，采样会损害性能。此外，在softmax的情况下，40000个条目并不是那么糟糕。

使用采样解码器输出
Seq2Seq在TensorFlow教程中使用了桶
Tensorflow采样Softmax丢失正确使用
Tensorflow seq2seq教程中的分布式学习
Seq2Seq损失功能帮助Tensorflow
1.4f seq2seq教程中的采样丢失
为什么TensorFlow的采样softmax损失在采样类上停止了梯度？
Seq2Seq模型和损失函数（在keras中）
Tensorflow seq2seq教程404
在pytorch中注意seq2seq教程的错误？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？