我正在实现一个使用Leacock Chodorrow相似性来测量两种类型之间相似性的应用程序。
-log (shortestPath(type1, type2) / (2 * taxonomyDepth))
我的问题是为什么通过总分类深度而不是更具体类型的深度或两种类型的平均值来对度量进行归一化。我的理由是,在较高级别上具有相同父级的类型与在较低级别级别上具有相同父级的类型不太相似。例如。在DBpedia本体中,活动和代理都是猫头鹰的孩子:Thing。拳击联赛和自行车联盟也是同一家长SportsLeague的孩子,并且具有相同的Leacock chodorow相似性。