如何在Unicode数据上使用NLTK Python进行SVM标记

时间:2015-07-03 20:17:00

标签: unicode nltk svm python-3.4

任何人都可以帮我解决如何在NLTK Python中使用SVM标记的问题。 我使用TnT标记符有以下代码。它对我来说非常有效,从而生成标记输出。

如何用svm实现标记? 请帮助..谢谢

import nltk
import re
import time
from nltk.corpus import indian
train_data = indian.tagged_sents('konkani.pos')[:300]
from nltk.tag import tnt
l = tnt_pos_tagger = tnt.TnT()
n=tnt_pos_tagger.train(train_data)
e = open('kkn-.txt',encoding='utf-8-sig').read()
print (tnt_pos_tagger.tag(nltk.word_tokenize(e)))

0 个答案:

没有答案