RDFStore /查询性能

时间:2012-05-02 18:33:36

标签: semantic-web

我尝试将语义数据模型用于我的应用程序,因为它具有可扩展性。我已经阅读了RDFStores(芝麻,耶拿等)中的性能/规模比较以及它们自己的优点和缺点

但是,我想知道语义数据存储与传统的mysql查询和数据库对查询性能的影响是什么。

RDBMS优化了索引和查询计划,以加快响应速度。我们是否因为语义数据存储而失去了它们?有研究吗?

你能提供指针/资源吗?

1 个答案:

答案 0 :(得分:1)

我认为,对于重叠的任务,关系数据库通常会比三重存储更快。但这并不奇怪,关系数据库在研究和开发方面有着长达数十年的领先优势。发展。

因此,如果您有一个易于在关系模型和RDF模型中表示的任务,那么使用关系数据库可能会更快。

但这并不是说三重存储不是快速或可扩展的,这是一种谬论。它们针对存储RDF和回答SPARQL查询的要求进行了优化。我不是一名学者,但在过去的十年中,我觉得这些领域的研究有所增加。

我会说所有都有优化的索引,这些优化的工作方式和应用方式可能会因商店的不同而不同,因为每个查询引擎的访问模式都不同,但它们已经得到了很好的优化。你不能像对待关系商店一样修补它们,但根据我的经验,这是最好的。数据库供应商知道他们应该如何表现得比用户更好。

大多数查询规划程序或查询引擎中内置了至少某种形式的查询优化。

最后,与耶拿相比,三联店数量明显增加。芝麻,主要是 API 进入三重商店,但它们特别提供TDB& Sesame Native作为他们本土的三重商店实施。 Stardog,OWLIM,Virtuoso,4Store,Mulgara,Parliament,BigData也是其他一些产品。

缺点是,如果RDF适合您的应用程序,则使用它,并使用三重存储。如果关系模型更有意义,那么请使用标准关系数据库。如果你试着将一个人穿上另一个,你就会度过一段美好的时光。