我用老师强迫训练编码器-解码器模型。该模型完全适合我的数据集(即训练精度为100%)。然后,我将训练数据传递给训练后的模型,并要求其做出一些预测。这次我没有使用任何老师的强迫,即我在每个时间步从输出分布中采样(使用贪婪方法)并通过了采样的i.d.到下一个步骤。但是,训练集的准确性下降到约50%。这是正常现象吗?
此外,在这种情况下,我在训练期间的准确性为100%,因此即使我继续进行进一步训练,该模型也不会改善太多。但是该模型还不够好,因为在没有老师强迫的情况下,准确性仅为50%。那么,在这种情况下我该怎么办?例如,我应该取消老师的强迫吗?