我刚开始研究tensorflow不久。我正在研究seq2seq模型并使用seq2seq示例代码。
我想修改seq2seq模型代码以获得强化学习模型的top-k输出(k为5或10),而不是获得前1输出。
首先,我想我应该以某种方式修改seq2seq的解码器部分,但我不知道要改变哪一部分。
该问题是否有任何参考或代码?
答案 0 :(得分:0)
check out https://github.com/tensorflow/tensorflow/issues/654. There are some discussions on this, but no worked example yet.
答案 1 :(得分:0)