应用错误收集

将大型RDF文件加载到Sesame中

时间：2014-11-26 13:51:48

标签： sesame openrdf rdf4j

我正在尝试基于Sesame创建一个SPARQL端点。我安装了Tomcat，PostgreSQL，并部署了一个Sesame的Web应用程序。我创建了一个基于PostgreSQL RDF存储库的存储库。现在我需要将一个大的ttl文件（540M三元组，文件大小为几GB）加载到存储库中。在Workbench上加载大文件不是一个好的解决方案 - 需要几天时间。加载数据的最佳非编程解决方案是什么？是否有像“console”这样的工具来加载数据？例如，Virtuoso有用于批量加载的isql工具......

1 个答案:

答案 0 :(得分：1)

我所知道的Sesame没有现成的批量加载工具 - 虽然与Sesame兼容的三元组供应商确实有这样的工具可用作其特定数据库的一部分。对批量上传解决方案进行编程并不是特别困难，但我们在某种程度上从来没有在Sesame核心发行版中包含这样的工具。

顺便提一下，对于芝麻的任何默认存储来说，540M三元组可能太大了 - 本机存储只能扩展到大约150M，并且将这么大的数据集加载到内存存储中太笨重了（即使你有可用内存）。因此，您可能需要考虑使用第三方提供的与Sesame兼容的数据库。有许多选择，包括商业和免费/开源，请参阅this overview on the Sesame website以获取一些建议列表。