deep-learning - 如果没有使用教师强迫训练的模型，是否应该提供相同的结果？

我用老师强迫训练编码器-解码器模型。该模型完全适合我的数据集（即训练精度为100％）。然后，我将训练数据传递给训练后的模型，并要求其做出一些预测。这次我没有使用任何老师的强迫，即我在每个时间步从输出分布中采样（使用贪婪方法）并通过了采样的i.d.到下一个步骤。但是，训练集的准确性下降到约50％。这是正常现象吗？

此外，在这种情况下，我在训练期间的准确性为100％，因此即使我继续进行进一步训练，该模型也不会改善太多。但是该模型还不够好，因为在没有老师强迫的情况下，准确性仅为50％。那么，在这种情况下我该怎么办？例如，我应该取消老师的强迫吗？

如果没有使用教师强迫训练的模型，是否应该提供相同的结果？

0 个答案: