我正在使用此处的工具执行语义相似性,
我收到了以下结果,但无法正确解释它们:
apple#n#1,banana#n#1 0.04809463683080774
apple#n#1,banana#n#2 0.13293629283742603
apple#n#2,banana#n#1 0.0
apple#n#2,banana#n#2 0.0
这是代码:
URL url = new URL ( "file" , null , "dictionary/3.0/dict" );
IDictionary dict = new Dictionary ( url ) ;
dict.open () ;
// look up first sense of the word " dog "
IIndexWord idxWord = dict . getIndexWord ( "dog" , POS.NOUN ) ;
IWordID wordID = idxWord . getWordIDs () . get (0) ; // 1 st meaning
List <IWordID> wordIDs = idxWord.getWordIDs();
JWS ws= new JWS ("dictionary", "3.0");
TreeMap <String,Double> scores1 = ws.getJiangAndConrath().jcn("apple", "banana", "n");
for (String s:scores1.keySet())
System.out.println(s+"\t"+scores1.get(s));
答案 0 :(得分:1)
Jiang Conrath相似性返回一个表示两者相似程度的分数 根据最少的信息内容(IC),词义是 Common Subsumer(最具体的祖先节点)和两者的 输入Synsets。该关系由等式1 /(IC(s1)+给出 IC(s2) - 2 * IC(lcs))。
结果为0表示这两个概念完全没有关系。 接近1的结果意味着非常密切的关系。
答案 1 :(得分:0)
你可以把我用JAVA编写的代码源负责执行LeacockAndChodorow算法,因为我对Url变量有一些问题吗?