是否可以在此代码中读取我自己的数据培训/数据集?

时间:2016-12-01 00:52:47

标签: python nltk

我需要帮助。我已经向店主提出了这个问题,但尚未回答。有人会告诉我是否可以更改此部分的参数,好吗?我刚刚开始用NLTK学习python,我还没有尝试过定制。我的目的是使用Arne Neumann制作的这个真棒MaxEnt脚本来分析印度尼西亚语。我已经有了数据集。

if corpus.lower() == "brown":
    from nltk.corpus import brown
    tagged_sents = brown.tagged_sents()[:num_sents]
elif corpus.lower() == "treebank":
    from nltk.corpus import treebank
    tagged_sents = treebank.tagged_sents()[:num_sents]
else:
    print "Please load either the 'brown' or the 'treebank' corpus."

是否可以将语料库的给定参数修改为另一个文档?我计划使用充满推文的印尼文件。到目前为止,我得到了印尼语单词的数据集(https://github.com/drr3d/BimaNLP/tree/master/dataset)。这个maxent-pos-tagger可以和给定的数据集一样工作吗?非常感谢你!

0 个答案:

没有答案