我的问题与WordNet Interface有关。
>>> wn.synsets('cat')
[Synset('cat.n.01'), Synset('guy.n.01'), Synset('cat.n.03'),
Synset('kat.n.01'), Synset('cat-o'-nine-tails.n.01'),
Synset('caterpillar.n.02'), Synset('big_cat.n.01'),
Synset('computerized_tomography.n.01'), Synset('cat.v.01'),
Synset('vomit.v.01')]
>>>
我无法在n
或number
中找到cat.n.01
和以下caterpillar.n.02
目的的答案。
答案 0 :(得分:4)
根据NLTK docs,<lemma>.<pos>.<number>
Synset字符串由以下部分组成:
<lemma>
是单词的形态词干<pos>
是ADJ,ADJ_SAT,ADV,NOUN或VERB模块属性之一- 开始计算
<number>
是感应数字,从0
因此,<pos>
是词性的一部分。
根据{{3}},词性特征具有以下含义:
n NOUN
v VERB
a ADJECTIVE
s ADJECTIVE SATELLITE
r ADVERB
<number>
用于消除词义的消歧。