如何在NLTK中修改pos_tag的源代码?

时间:2013-11-19 22:27:12

标签: python nltk

我正在为NLP课程开发一个项目,我正在使用语料库,而且有些单词被错误地标记了。有没有人知道如何修改源代码(或获取它)进行词性标注,以便我可以玩并纠正它?

-Emily

1 个答案:

答案 0 :(得分:2)

  

有谁知道如何修改源代码

是。与几乎所有开源项目一样,从首页直接链接到源代码。在这种情况下,它是右侧导航栏上的“开发”按钮。点击它,它会带你到回购。安装包的文档中也有相同的链接。 The repo今天在GitHub上,但如果将来有所动作,主页几乎肯定会改为指向新位置。

一旦你到达nltk repo(或nltk3-alpha,如果你使用的是alpha版本),请将它分叉,克隆它,然后你可以在本地找到源代码。您可以猜测nltk.tag.pos_tag将位于nltk/tag/目录中,很可能位于__init__.pyfrom foo import中的其他模块中,或者您只能使用grep 1}},ack,您喜欢的IDE中的“在文件中查找”菜单项等,以找到该功能。

无论您是想维护自己的叉子,没有其他人会感兴趣,或者向上游提交补丁,GitHub的帮助将解释如何做到这一点。