如何有效加载rdf文件进行查询

时间:2014-02-07 12:35:59

标签: rdf jena tdb

我正在使用Apache Jena的tdbloader来创建基于查询的Web应用程序。我的Web应用程序选择一个特定的数据库(一个Turtle文件)并加载它。目前我正在使用标准tdbloader来加载所选文件。但是,当数据集很大时,加载大约需要十五分钟。 有没有办法在更短的时间内有效地完成上述工作或先加载它?

2 个答案:

答案 0 :(得分:1)

你的问题确实没有多大意义。

TDB是一个持久性数据库,所以如果你有一组已知的数据文件,你只需要从每个数据文件创建和加载一次数据库,很可能是离线的。然后在您的应用程序中,您只需为现有数据库打开TDBDataset,然后继续查询,就像使用Jena的ARQ API的任何其他数据集一样。

听起来您的应用程序可能没有经过适当设计,因为您暗示每次要查询时都会将数据加载到数据库中,这非常浪费。

您可能需要阅读以下内容:

答案 1 :(得分:1)

我想你可能对这些问题及其答案感兴趣

TDB以比普通RDF文件更高效的格式将数据存储在磁盘上。您应该使用tdbloader 一次加载数据,然后针对tdbloader生成的磁盘表示运行查询。你可以用tdbquery做到这一点(作为我对第二个问题的回答)。