在NLTK Python中使用Stanford POS Tagger时出错

时间:2014-04-08 07:27:05

标签: python-2.7 nltk stanford-nlp pos-tagger

我正在尝试在NLTK中使用Stanford POS Tagger,但我无法运行此处给出的示例代码http://www.nltk.org/api/nltk.tag.html#module-nltk.tag.stanford

import nltk
from nltk.tag.stanford import POSTagger
st = POSTagger(r'english-bidirectional-distim.tagger',r'D:/stanford-postagger/stanford-postagger.jar')
st.tag('What is the airspeed of an unladen swallow?'.split())

我已将环境变量添加为

CLASSPATH = D:/stanford-postagger/stanford-postagger.jar
STANFORD_MODELS =  D:/stanford-postagger/models/

这是我一直得到的错误

追踪(最近一次呼叫最后一次):

File "D:\pos_stanford.py", line 4, in <module>
    st = POSTagger(r'english-bidirectional-distim.tagger',
         r'D:/stanford-postagger/stanford-postagger.jar')  
... LookupError: NLTK was unable to find the english-bidirectional-distim.tagger file! Use software specific configuration paramaters or set the STANFORD_MODELS environment variable.

有些论坛建议

File "C:\Python27\lib\site-packages\nltk\tag\stanford.py", line 45, in __init__
env_vars=('STANFORD_MODELS'), verbose=verbose)

应该更改,以便

中有逗号
env_vars=('STANFORD_MODELS',), verbose=verbose)

但它也没有解决问题。 请帮我解决这个问题。

其他资讯: 我在用 Windows 7 64位 Python 2.7 32位 NLTK 2.0

1 个答案:

答案 0 :(得分:11)

注意:只是将其作为答案发布,以防其他人在将来遇到此问题

我终于发现了我做错了什么......结果证明是一个大错。

Tagger文件名不是'english-bidirectional-distim.tagger' 但是'english-bidirectional-distsim.tagger'。