WordNet - n和数字代表什么?

时间:2016-01-16 19:28:22

标签: python nlp nltk wordnet part-of-speech

我的问题与WordNet Interface有关。

   >>> wn.synsets('cat')
       [Synset('cat.n.01'), Synset('guy.n.01'), Synset('cat.n.03'),
        Synset('kat.n.01'), Synset('cat-o'-nine-tails.n.01'), 
        Synset('caterpillar.n.02'), Synset('big_cat.n.01'), 
        Synset('computerized_tomography.n.01'), Synset('cat.v.01'), 
        Synset('vomit.v.01')]
    >>> 

我无法在nnumber中找到cat.n.01和以下caterpillar.n.02目的的答案。

1 个答案:

答案 0 :(得分:4)

根据NLTK docs<lemma>.<pos>.<number> Synset字符串由以下部分组成:

  
      
  • <lemma>是单词的形态词干
  •   
  • <pos>是ADJ,ADJ_SAT,ADV,NOUN或VERB模块属性之一
  •   
  • <number>是感应数字,从0
  • 开始计算   

因此,<pos>是词性的一部分。 根据{{​​3}},词性特征具有以下含义:

n    NOUN
v    VERB
a    ADJECTIVE
s    ADJECTIVE SATELLITE
r    ADVERB 

<number>用于消除词义的消歧。