语义相似度结果解释

时间:2013-03-07 19:32:50

标签: semantics wordnet

我正在使用此处的工具执行语义相似性,

我收到了以下结果,但无法正确解释它们:

apple#n#1,banana#n#1    0.04809463683080774
apple#n#1,banana#n#2    0.13293629283742603
apple#n#2,banana#n#1    0.0
apple#n#2,banana#n#2    0.0

这是代码:

URL url = new URL ( "file" , null , "dictionary/3.0/dict" );
        IDictionary dict = new Dictionary ( url ) ;
        dict.open () ;

        // look up first sense of the word " dog "
        IIndexWord idxWord = dict . getIndexWord ( "dog" , POS.NOUN ) ;
        IWordID wordID = idxWord . getWordIDs () . get (0) ; // 1 st meaning
        List <IWordID> wordIDs = idxWord.getWordIDs();


        JWS ws= new JWS ("dictionary", "3.0");


        TreeMap <String,Double> scores1 = ws.getJiangAndConrath().jcn("apple", "banana", "n");
        for (String s:scores1.keySet())
            System.out.println(s+"\t"+scores1.get(s));

2 个答案:

答案 0 :(得分:1)

来自NLTK Documentation:

  

Jiang Conrath相似性返回一个表示两者相似程度的分数   根据最少的信息内容(IC),词义是   Common Subsumer(最具体的祖先节点)和两者的   输入Synsets。该关系由等式1 /(IC(s1)+给出   IC(s2) - 2 * IC(lcs))。

结果为0表示这两个概念完全没有关系。 接近1的结果意味着非常密切的关系。

答案 1 :(得分:0)

你可以把我用JAVA编写的代码源负责执行LeacockAndChodorow算法,因为我对Url变量有一些问题吗?