NLTK似乎没有交叉验证方法。
我试图在NLTK中开发一个基于隐马尔可夫模型(HMM)的标记器。 我在相关主题上找到了previous post。根据这里的答案,如果我尝试将其写成,
cv = cross_validation.KFold(len(train_corp), n_folds=10,shuffle=False)
for traincv, testcv in cv:
hmm_tagger=nltk.HiddenMarkovModelTagger.train(train_corp[traincv[0]:traincv[len(traincv)-1]])
evaluation=hmm_tagger.evaluate(train_corp[testcv[0]:testcv[len(testcv)-1]])
print evaluation
我很好吗?
如果有人建议的话。