将外部文本数据索引到GraphDB中的Lucene索引

时间:2018-12-11 18:07:32

标签: java lucene graphdb

是否可以在RDF数据外部建立索引? 就像在RDF中一样,该对象有一个三元组,它是指向外部文件的链接。可以索引此文件的内容而不是链接值吗?

2 个答案:

答案 0 :(得分:1)

绝对。 Lucene是GraphDB的核心部分,它提供了独立Lucene附带的标准功能。数据将必须参数化为字符串文字。 <http://www.example.org/> rdfs:label "An example webpage url."@EN . 然后,您可以配置Lucene索引:

PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
INSERT DATA {
  luc:index luc:setParam "uris" .
  luc:include luc:setParam "literals" .
  luc:moleculeSize luc:setParam "1" .
  luc:includePredicates luc:setParam "http://www.w3.org/2000/01/rdf-schema#label" .
}

配置完成后,就可以创建索引。

PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
INSERT DATA {
   luc:myTestIndex luc:createIndex "true" .
}

而且,有了索引和您的数据,您就可以查询它。

PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
SELECT * {
  ?subj luc:myTestIndex "web*"
}

由于您要查询包含字符串web *的主题,因此您将获得<http://www.example.org/>。如果您还有其他与此相关的三元组链接,它们可能也会出现。

有关GraphDB与Lucene交互方式及其Full-Text-Search功能的更多信息,可以在GraphDB文档中找到。

答案 1 :(得分:0)

我怀疑上面的答案误解了这个问题。该问题涉及外部内容,即GraphDB的Lucene是否能够索引http://example.org上可用的内容,而不是与其关联的RDF文字(然后返回搜索指向该内容的三元组)。 >

从我无法尝试的结果来看,目前不支持此功能。