你能想到任何同时加载和查询RDF三元组的方法吗?
我只知道在Sesame中你必须首先初始化一个存储库(比如加载rdf文件),然后你就可以通过SPARQL进行查询。
想象一下,我们初始化一个RDF存储库(输入文件)并且不希望加载完成,但在加载RDF数据的同时,想要通过SPARQL查询数据以进行验证。
对于下面的初始化,应该等到存储库中RDF文件的加载完成(我的假设),然后你可以在存储库中查询RDF数据:
File rdfFile; // parameter, RDF file.
repo = new SailRepository(new MemoryStore());
repo.initialize();
try {
RepositoryConnection con = repo.getConnection();
try {
con.add(rdfFile, null, rdfFormat);
} finally {
con.close();
}
}
在上面的代码中,RepositoryConnection.add
获取File
作为参数。提供FileInputStream
作为参数可以解决问题吗? (存储库的初始化不等待加载文件,并且可以在加载完成之前进行查询。)
答案 0 :(得分:2)
使用FileInputStream
代替File
不会对Sesame处理文件的方式产生影响:add
方法在完全添加后仍然不会返回数据
但是,您可以通过在加载文件的单独线程中执行查询,然后使用隔离级别为READ_UNCOMMITTED
的事务来实现所需的功能。当然,在这种情况下,几乎没有保证查询结果的完整性或一致性,但这在技术上是可行的。
像这样的东西(从我的头顶,未经测试):
File rdfFile; // parameter, RDF file.
repo = new SailRepository(new MemoryStore());
repo.initialize();
Thead loader = new Thread() {
public void run() {
try (RepositoryConnection con = repo.getConnection()) {
con.add(rdfFile, null, rdfFormat);
}
}
};
Thead query = new Thread() {
public void run() {
try (RepositoryConnection con = repo.getConnection()) {
conn.begin(IsolationLevels.READ_UNCOMMITTED);
String query = "SELECT * WHERE ... ";
try(TupleQueryResult result = conn.prepareTupleQuery(query).evaluate()) {
while (result.hasNext()) {
...
}
}
conn.commit();
}
};
loader.start();
query.start();