为部落语言POS标签创建语料库

时间:2019-02-19 18:27:12

标签: python nlp nltk corpus

我正在使用NLTK从文本字符串中提取名词,并且它的每个单词中都已经使用(ibaloi)语言在其中带有POS标签,这些标签随后将用于创建语法:

sentence = "this is a tribal language"
words = nltk.word_tokenize(sentence)
taggedWords = tagged_text = nltk.pos_tag(nltk.Text(words))

英语没有问题。 是否有办法使它也可以使用部落(ibaloi)语言?

(我是自然语言处理的新手,正在学习一些很好的教程。)

1 个答案:

答案 0 :(得分:0)

您可能要参考this类似的问题,其中OP还具有一个Excel文件中的单词列表,其中包含单词和词性(名词,动词等),而不是NLTK。< / p>