如何同时加载和查询RDF

时间:2015-12-09 14:58:38

标签: java rdf sparql semantic-web sesame

你能想到任何同时加载和查询RDF三元组的方法吗?

我只知道在Sesame中你必须首先初始化一个存储库(比如加载rdf文件),然后你就可以通过SPARQL进行查询。

想象一下,我们初始化一个RDF存储库(输入文件)并且不希望加载完成,但在加载RDF数据的同时,想要通过SPARQL查询数据以进行验证。

对于下面的初始化,应该等到存储库中RDF文件的加载完成(我的假设),然后你可以在存储库中查询RDF数据:

File rdfFile; // parameter, RDF file.
repo = new SailRepository(new MemoryStore());
repo.initialize();

        try {
            RepositoryConnection con = repo.getConnection();
            try {
                con.add(rdfFile, null, rdfFormat);
            } finally {
                con.close();
            }
        }

在上面的代码中,RepositoryConnection.add获取File作为参数。提供FileInputStream作为参数可以解决问题吗? (存储库的初始化不等待加载文件,并且可以在加载完成之前进行查询。)

1 个答案:

答案 0 :(得分:2)

使用FileInputStream代替File不会对Sesame处理文件的方式产生影响:add方法在完全添加后仍然不会返回数据

但是,您可以通过在加载文件的单独线程中执行查询,然后使用隔离级别为READ_UNCOMMITTED的事务来实现所需的功能。当然,在这种情况下,几乎没有保证查询结果的完整性或一致性,但这在技术上是可行的。

像这样的东西(从我的头顶,未经测试):

   File rdfFile; // parameter, RDF file.
   repo = new SailRepository(new MemoryStore());
   repo.initialize();

   Thead loader = new Thread() {
      public void run() {
       try (RepositoryConnection con = repo.getConnection()) {
            con.add(rdfFile, null, rdfFormat);
       }
      }
   };
   Thead query = new Thread() {
      public void run() {
       try (RepositoryConnection con = repo.getConnection()) {
        conn.begin(IsolationLevels.READ_UNCOMMITTED);
        String query = "SELECT * WHERE ... "; 
        try(TupleQueryResult result = conn.prepareTupleQuery(query).evaluate()) {
           while (result.hasNext()) {
                ...
           }
        }
        conn.commit();
      }
   };
   loader.start(); 
   query.start();