我正在做英文POS标签这么久。像
一样直播前进>>> text = word_tokenize("And now for something completely different")
>>> nltk.pos_tag(text)
[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'),
('completely', 'RB'), ('different', 'JJ')]
但我想在泰卢固语中这样做。
但我无法弄清楚测试任何随机泰卢固语文本的方法。如果他有使用NLTK非英语文本的经验,请有人指导。
我有总数字
telugu.pos
9999
句
1197
telugu.pos