使用SPARQL和DBPedia测量主题之间的距离

时间:2014-02-10 23:35:35

标签: sparql dbpedia

假设您有一个文档提到“土耳其”和“伊斯坦布尔”,您想要提取这些关键字并将其与维基百科文章相匹配。但对于“火鸡”而言,它可能意味着土耳其这个国家或火鸡这个鸟。然后可以使用第二个关键字伊斯坦布尔来衡量它与正确的“土耳其”之间的“距离”。所以:

伊斯坦布尔 - >土耳其这个国家 - >关闭。

伊斯坦布尔 - >土耳其鸟 - >遥远。

进一步解释我对距离的意义:据我所知,SPARQL可以遍历图形,而DBPedia是一种(知识)图形,所以我正在寻找的距离可能在图形中。

1 个答案:

答案 0 :(得分:2)

如果资源之间存在唯一路径,则可以在SPARQL中找到两个资源之间的路径长度。 (现在已经在很多地方对此进行了描述;例如,this answerCalculate length of path between nodes?。)但是,如果有多个路径加入端点,则无法使用该技术,因为它通过计算节点来工作资源之间的路径,所以如果有多条路径,它将不会非常有用。

在DBpedia中,任何一对资源之间可能存在很多路径,因此使用这种度量标准相当困难。但是,您可以使用的另一种方法是找到最接近的公共超类,并使用基于该公式的度量。 this answerfinding common superclass and length of path in class hierarchies已讨论过这种方法。