语义搜索的增量索引

时间:2016-03-23 06:42:08

标签: indexing rdf semantic-web triplestore

我想知道是否有一些标准或最佳实践,在为语义搜索目的执行三重存储的增量索引时。

实际上,为了支持语义搜索,通常使用solr或elasticsearch,其中资源根据某些特定的SPARQL查询进行索引。例如,虽然人们可以每天重新索引其整个资源集,但这并不理想。因此需要逐步执行它。然而,这需要以某种方式跟踪变化,最终的山羊能够继续索引或删除任何只有变化的东西。

例如,为了仅索引已更改的内容,SPARQL查询应以某种方式包含一些时间戳过滤器。

如果有人有任何建议或经验,那么他想分享这个建议会很好吗

到目前为止,我受到了EEA ElasticSearch RDF River插件的启发。我也在研究本体变更本体论。

1 个答案:

答案 0 :(得分:1)

实现此目标的最简单方法是获取事务生命周期中涉及的内容。然后,您就可以看到对数据库的更改,这些更改将为您提供需要编制索引的图表。

但是不要在周期性日程安排中完成重新索引,例如每晚。除非您的要求是全文搜索必须始终违反最新数据您的数据快速变化,否则定期完整的重新索引将会正常工作。