前段时间,SO上有人问how to retrieve a list of words for a given synset使用NLTK的wordnet包装器。以下是建议的回复之一:
for synset in wn.synsets('dog'):
print synset.lemmas[0].name
使用NLTK 3.0运行此代码会产生TypeError: 'instancemethod' object is not subscriptable
。
我尝试了之前提出的每个解决方案(上面链接的页面中描述的每个解决方案),但每个都会抛出错误。因此,我想问:是否可以使用NLTK 3.0打印单词列表?我会感谢别人可以就这个问题提出的任何建议。
答案 0 :(得分:15)
WordNet在NLTK 3.0中运行良好。您只是以错误的方式访问lemmas(和名称)。试试这个:
>>> import nltk
>>> nltk.__version__
'3.0.0'
>>> from nltk.corpus import wordnet as wn
>>> for synset in wn.synsets('dog'):
for lemma in synset.lemmas():
print lemma.name()
dog
domestic_dog
Canis_familiaris
frump
dog
dog
cad
bounder
blackguard
...
synset.lemmas
是一种方法,没有__getitem__()
方法(因此不可订阅)。
答案 1 :(得分:10)
您还可以使用Take(200)
直接转到引理名称:
lemma_names()
它适用于多种语言
>>> wordnet.synset('dog.n.1').lemma_names()
['dog', 'domestic_dog', 'Canis_familiaris']
答案 2 :(得分:7)
使用:
wn.synset('dog.n.1').name()
而不是:
wn.synset('dog.n.1').name
因为NLTK改变了Synset属性以获取函数。见https://github.com/nltk/nltk/commit/ba8ab7e23ea2b8d61029484098fd62d5986acd9c
这是适用于py3.x的NLTK API的一个很好的变化列表:https://github.com/nltk/nltk/wiki/Porting-your-code-to-NLTK-3.0