应用错误收集

我正在做英文POS标签这么久。像

一样直播前进

>>> text = word_tokenize("And now for something completely different")
>>> nltk.pos_tag(text)
[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'),
('completely', 'RB'), ('different', 'JJ')]

但我想在泰卢固语中这样做。

我遵循了这篇文章 - http://jaganadhg.freeflux.net/blog/archive/2009/10/12/nltk-and-indian-language-corpus-processing-part-ii.html

并且可以测试一些内置句子。

但我无法弄清楚测试任何随机泰卢固语文本的方法。如果他有使用NLTK非英语文本的经验，请有人指导。

我有总数字

telugu.pos
    9999

句

1197
telugu.pos

如何在泰卢固语文本上进行POS标记？

0 个答案: