我正在尝试在NLTK中使用Stanford POS Tagger,但我无法运行此处给出的示例代码http://www.nltk.org/api/nltk.tag.html#module-nltk.tag.stanford
import nltk
from nltk.tag.stanford import POSTagger
st = POSTagger(r'english-bidirectional-distim.tagger',r'D:/stanford-postagger/stanford-postagger.jar')
st.tag('What is the airspeed of an unladen swallow?'.split())
我已将环境变量添加为
CLASSPATH = D:/stanford-postagger/stanford-postagger.jar
STANFORD_MODELS = D:/stanford-postagger/models/
这是我一直得到的错误
追踪(最近一次呼叫最后一次):
File "D:\pos_stanford.py", line 4, in <module>
st = POSTagger(r'english-bidirectional-distim.tagger',
r'D:/stanford-postagger/stanford-postagger.jar')
... LookupError: NLTK was unable to find the english-bidirectional-distim.tagger file! Use software specific configuration paramaters or set the STANFORD_MODELS environment variable.
有些论坛建议
File "C:\Python27\lib\site-packages\nltk\tag\stanford.py", line 45, in __init__
env_vars=('STANFORD_MODELS'), verbose=verbose)
应该更改,以便
中有逗号env_vars=('STANFORD_MODELS',), verbose=verbose)
但它也没有解决问题。 请帮我解决这个问题。
其他资讯: 我在用 Windows 7 64位 Python 2.7 32位 NLTK 2.0
答案 0 :(得分:11)
注意:只是将其作为答案发布,以防其他人在将来遇到此问题
我终于发现了我做错了什么......结果证明是一个大错。
Tagger文件名不是'english-bidirectional-distim.tagger' 但是'english-bidirectional-distsim.tagger'。