假设您有一个文档提到“土耳其”和“伊斯坦布尔”,您想要提取这些关键字并将其与维基百科文章相匹配。但对于“火鸡”而言,它可能意味着土耳其这个国家或火鸡这个鸟。然后可以使用第二个关键字伊斯坦布尔来衡量它与正确的“土耳其”之间的“距离”。所以:
伊斯坦布尔 - >土耳其这个国家 - >关闭。
伊斯坦布尔 - >土耳其鸟 - >遥远。
进一步解释我对距离的意义:据我所知,SPARQL可以遍历图形,而DBPedia是一种(知识)图形,所以我正在寻找的距离可能在图形中。
答案 0 :(得分:2)
如果资源之间存在唯一路径,则可以在SPARQL中找到两个资源之间的路径长度。 (现在已经在很多地方对此进行了描述;例如,this answer到Calculate length of path between nodes?。)但是,如果有多个路径加入端点,则无法使用该技术,因为它通过计算节点来工作资源之间的路径,所以如果有多条路径,它将不会非常有用。
在DBpedia中,任何一对资源之间可能存在很多路径,因此使用这种度量标准相当困难。但是,您可以使用的另一种方法是找到最接近的公共超类,并使用基于该公式的度量。 this answer至finding common superclass and length of path in class hierarchies已讨论过这种方法。