如何对多个RDF文件执行SPARQL查询?

时间:2015-12-18 20:09:00

标签: rdf jena semantic-web sesame

我有 44 t.integer "type", default: 0 个文件,总内存 117 GB 。我很好奇实时执行所有.ttl文件的SPARQL查询的有效方法。我尝试将它们组合在一起,但加载模型需要花费大量时间.ttl以及组合。那么,最有效的方法是什么?

2 个答案:

答案 0 :(得分:3)

将它们装入一个三重商店,例如Jena的TDB。您可以根据需要将其分为一个大图或单独的命名图。

当您要执行查询时,这将保存所有数据解析时间。

答案 1 :(得分:2)

我没有用过耶拿;但如果我使用芝麻,这就是我要做的。

  1. 如果要成为企业应用程序,请避免依赖DBpedia端点。公共可用的SPARQL端点有时会停机以进行维护。发生这种情况时,您将无法执行查询。
  2. 您可以将.ttl文件加载到triplestore,也可以使用带有SERVICE子句的SPARQL 1.1的INSERT或INSERT DATA功能将数据直接从DBpedia上传到您的triplestore。
  3. 如果可能,将所有数据存储在单个图表中。运行联合查询在计算上更加昂贵,并且考虑到大型数据集,它可能会成为一个问题。
  4. 要区分来源,您可以定义'上下文' (每个数据集的图形名称)。芝麻称它为上下文,Jena可能有相同的东西。
  5. 查询时,尽量避免计算量大的查询(例如运行包含大量结果的查询,然后应用过滤器)。通常,尝试想象图形模式对结果的影响,并尝试在查询中复制它。