我想描述大约50,000个(或可能更多)文档。我使用Jena创建了一个默认模型,并开始添加资源和相应的属性。我还没有完成三重商店或使用Jena的TDB数据集。什么是确保未来查询和最重要的更新更有效/更快的最佳实践。有人建议命名每个图形和/或将它们分隔在不同的文件中。
答案 0 :(得分:1)
如果您拥有的数据多于方便存储在内存中的数据,请使用RDF数据库。磁盘上的许多文件不太可能有效。
使用进程内数据库,如Apache Jena TDB,或共享RDF数据库服务器(Jena Fuseki)。
单独的服务器意味着您可以使用您想要的任何SPARQL兼容系统。