我正在为NLP课程开发一个项目,我正在使用语料库,而且有些单词被错误地标记了。有没有人知道如何修改源代码(或获取它)进行词性标注,以便我可以玩并纠正它?
-Emily
答案 0 :(得分:2)
有谁知道如何修改源代码
是。与几乎所有开源项目一样,从首页直接链接到源代码。在这种情况下,它是右侧导航栏上的“开发”按钮。点击它,它会带你到回购。安装包的文档中也有相同的链接。 The repo今天在GitHub上,但如果将来有所动作,主页几乎肯定会改为指向新位置。
一旦你到达nltk repo(或nltk3-alpha,如果你使用的是alpha版本),请将它分叉,克隆它,然后你可以在本地找到源代码。您可以猜测nltk.tag.pos_tag
将位于nltk/tag/
目录中,很可能位于__init__.py
或from foo import
中的其他模块中,或者您只能使用grep
1}},ack
,您喜欢的IDE中的“在文件中查找”菜单项等,以找到该功能。
无论您是想维护自己的叉子,没有其他人会感兴趣,或者向上游提交补丁,GitHub的帮助将解释如何做到这一点。