这是Wordnet上单词相似度测量的简单示例。
>>> dog = wn.synset('dog.n.01')
>>> cat = wn.synset('cat.n.01')
>>> dog.path_similarity(cat)
0.2
但是,“狗”一词具有多个同义词集,如下所示。 用上述方法测量相似度时,不可能包含所有同义词集。
>>> wn.synsets('dog') # doctest: +ELLIPSIS +NORMALIZE_WHITESPACE
[Synset('dog.n.01'), Synset('frump.n.01'), Synset('dog.n.03'), Synset('cad.n.01'),
Synset('frank.n.02'), Synset('pawl.n.01'), Synset('andiron.n.01'), Synset('chase.v.01')]
是否可以在不选择Wordnet上特定的同义词集的情况下测量相似性。例如“狗”和“猫”? 如果是这样,我们如何进行测量?