我正在尝试获取有关公司列表的相应DBPedia条目。我不知道如何进行近似匹配。 示例:在DBPedia中,“ Audi”被称为“ Audi AG”,而“ Novartis”被称为“ Novartis International AG”(foaf:name)。如何搜索rdf:type = dbo:Company且名称最接近我提供的名称的条目?
我正在使用SPARQL作为查询语言。 (但是,如果有优势,我愿意改变。)
select ?company
where {
?company foaf:name "Novartis"@en.
?company a dbo:Company.
}
LIMIT 100
我没有命中,但应该找到http://dbpedia.org/page/Novartis。匹配名称的开头可能就足够了。
答案 0 :(得分:1)
对于DBpedia,最好的选择可能是使用 bif:contains
全文搜索伪属性:
SELECT ?company {
?company a dbo:Company.
?company foaf:name ?name.
?name bif:contains "Novartis"@en.
}
此功能特定于为DBpedia SPARQL端点提供动力的Virtuoso数据库。
如果您要遵守标准SPARQL ,请仅在名称的开头匹配:
SELECT ?company {
?company a dbo:Company.
?company foaf:name ?name.
FILTER strStarts(?name, "Novartis")
}
与全文功能不同,此版本无法使用文本索引,因此速度较慢。
如果您想要更灵活的匹配:
SELECT ?company {
?company a dbo:Company.
?company foaf:name ?name.
FILTER contains(lCase(?name), lCase("Novartis"))
}
这将在名称中的任何位置找到不区分大小写的匹配项。