我是RDf的新手,我正在寻找具有出色读取性能的开源RDF数据库。每秒大约有100亿个三元组和100多个SPARQL查询。现在,我不需要随意读写数据库。
我已经看到维基百科中存在的数据库(http://en.wikipedia.org/wiki/SPARQL#SPARQL_implementations),但我想要一些专家建议,哪个是经过时间考验最多的系统。它应该具有Apache许可证或同等许可的许可证。
答案 0 :(得分:4)
Jena和Sesame可能是唯一符合您的许可标准的数据库,但它们都不会扩展到您需要的大小。 Jena与TDB 可能,但我不确定在那个规模上表现会是什么样的。 Sesame Native当然不是为那种规模设计的。
还有其他开源数据库,但它们是GPL,例如4store,可能符合您的性能标准。但最好的办法是使用商业数据库(大多数都有免费评估版);这是获得所需规模和读取吞吐量的最佳方式。但是,这意味着你可能不得不实际支付某人的辛勤工作,这让我知道。