芝麻内存三重店

时间:2012-07-09 21:18:37

标签: semantic-web triplestore sesame

- Using openrdf-sesame-latest
- Using in-memory repository in Sesame Standalone Server
- Using REST api interface (SPARQL queries) to Sesame Standalone server
- Have few hundred thousands triples for now
- have 16GB of memory on Sesame Server
- Moderate writes and reads

我只是在寻找专家的意见/帮助

我将其作为POC启动并在其上构建我的应用程序。我正在寻找4Stores和Mulgara,Alleograph(免费)选项。

  • 鉴于我的经验不足,我想知道什么时候会是absolutley 我必须离开芝麻服务器。
  • 是规模,安全性,写/读等性能吗?
  • 如果我只有10万三倍,我是否需要搬到其他商店?为什么?
  • 我打算将它用于生产用例。

正是我正在努力避免在移民中投入时间,除非绝对需要。让我换一种说法“我可以在生产中使用带有内存存储库(16GB)的openrdf-sesame-latest独立服务器吗?如果没有,为什么不呢?

1 个答案:

答案 0 :(得分:9)

作为芝麻开发者之一,我显然有偏见,但我不明白为什么你不能。

芝麻在许多生产环境中成功使用。内存存储器随着可用内存量的增加而扩展,虽然我个人从未测试过超过几百万个三元组,但我希望只要不用完堆空间就可以继续添加而不会造成重大性能损失。 。你提到100,000三倍,这很小,芝麻可以轻松应对数量级更大的数据集。

Sesame的一个优点还在于它实际上不是一个三元组,而是一个支持多个存储后端的框架和API。对于任何高达1.5亿三倍的东西,Sesame本地存储是一个很好的解决方案(更好的持久性,更少的内存占用,即使你拥有的数据量适合内存,这也许是使用它的好理由)。

如果您需要超越它,还有其他几个选项,包括支持Sesame API的第三方三重存储,如OWLIM或BigData,所以即使您发现需要更大的三重存储,您也不必在代码级别进行更改 - 您只需插入另一个商店即可。