标签: n-gram cross-validation
我试图了解交叉验证在ngram模型的上下文中是如何工作的。我知道该模型基本上列出了训练中语料库中每个ngram的概率。但是,交叉验证如何工作?我应该调整的参数是什么?我知道我希望在验证集上获得100%的准确率,但我不确定我需要调整什么来使其工作。这与平滑有关吗?