基于Li Wordnet的度量的相似度是什么?

时间:2014-02-04 03:44:18

标签: html-lists similarity wordnet measure

我对Li测量的相似性值感到困惑。我在纸上读到(0,1)中的值,所以它是否在0和1之间变化?或者它只有两个值0或1。

1 个答案:

答案 0 :(得分:0)

你是说林相似吗?它在0和1之间缩放,计算如下(引用NLTK documentation):

  

Lin相似度:返回分数   根据信息表示两个词义是多么相似   最不常见的消费者(最具体的祖先)的内容(IC)   节点)和两个输入Synsets的节点。这种关系由。给出   等式2 * IC(lcs)/(IC(s1)+ IC(s2))。

>>> dog.lin_similarity(cat, semcor_ic)
0.88632886280862277

您可以在this paper中找到不同单词相似度测量值之间的比较。它解释了Lin的相似性如下:

  

lin和jcn措施增强了LCS的信息内容   与概念A和B的信息内容的总和   他们自己。 lin测量缩放LCS的信息内容   通过这个总和,而jcn取这个和的差值   LCS的信息内容。