DBPedia:对以文字

时间:2019-04-15 23:40:08

标签: sparql dbpedia

我正在尝试获取有关公司列表的相应DBPedia条目。我不知道如何进行近似匹配。 示例:在DBPedia中,“ Audi”被称为“ Audi AG”,而“ Novartis”被称为“ Novartis International AG”(foaf:name)。如何搜索rdf:type = dbo:Company且名称最接近我提供的名称的条目?

我正在使用SPARQL作为查询语言。 (但是,如果有优势,我愿意改变。)

select ?company
where {
  ?company foaf:name "Novartis"@en.
  ?company a dbo:Company.
}
LIMIT 100

我没有命中,但应该找到http://dbpedia.org/page/Novartis。匹配名称的开头可能就足够了。

1 个答案:

答案 0 :(得分:1)

对于DBpedia,最好的选择可能是使用 bif:contains全文搜索伪属性:

SELECT ?company {
  ?company a dbo:Company.
  ?company foaf:name ?name.
  ?name bif:contains "Novartis"@en.
}

此功能特定于为DBpedia SPARQL端点提供动力的Virtuoso数据库。

如果您要遵守标准SPARQL ,请仅在名称的开头匹配

SELECT ?company {
  ?company a dbo:Company.
  ?company foaf:name ?name.
  FILTER strStarts(?name, "Novartis")
}

与全文功能不同,此版本无法使用文本索引,因此速度较慢。

如果您想要更灵活的匹配

SELECT ?company {
  ?company a dbo:Company.
  ?company foaf:name ?name.
  FILTER contains(lCase(?name), lCase("Novartis"))
}

这将在名称中的任何位置找到不区分大小写的匹配项。