NLTK Wordnet获取Python中的同义词集列表

时间:2018-07-02 13:59:41

标签: python list for-loop nltk wordnet

我正在使用NLTK Wordnet为意大利语创建引理和同义词集,看起来还可以:

from nltk.corpus import wordnet as wn

ll=wn.synsets('carta', lang='ita')
ll 

[Synset('card.n.01'),
 Synset('map.n.01'),
 Synset('sheet.n.02'),
 Synset('document.n.01'),
 Synset('charter.n.01'),
 Synset('menu.n.01'),
 Synset('paper.n.01')]

hypernyms[0].lemmas(lang="ita")
[Lemma('paper.n.01.carta')]

但是我试图在上一次操作之后不仅接收一个列表值,而且还列出我在ll中具有的所有同义词集的所有值。

使用了几种方法,但没有用:

第一个,仍在使用NLTK:

lemmas = wn.lemmas(ll, lang="ita")
'list' object has no attribute 'lower'

另一个带有循环:

i = iter(list(range(6)))

    for i in ll[i].lemmas(lang='ita'):
        print(ll[i].lemmas(lang='ita'))
list indices must be integers or slices, not list_iterator

如何解决?

1 个答案:

答案 0 :(得分:2)

使用列表理解

[synset.lemmas(lang='ita') for synset in ll]

输出

[[Lemma('card.n.01.carta')],
 [Lemma('map.n.01.carta'),
  Lemma('map.n.01.carta_geografica'),
  Lemma('map.n.01.cartina'),
  Lemma('map.n.01.mappa')],
 [Lemma('sheet.n.02.carta'), Lemma('sheet.n.02.foglio')],
 [Lemma('document.n.01.atto'),
  Lemma('document.n.01.carta'),
  Lemma('document.n.01.documento'),
  Lemma('document.n.01.incartamento'),
  Lemma('document.n.01.scrittura')],
 [Lemma('charter.n.01.carta'), Lemma('charter.n.01.statuto')],
 [Lemma('menu.n.01.carta'), Lemma('menu.n.01.menu'), Lemma('menu.n.01.menù')],
 [Lemma('paper.n.01.carta')]]