我有大约不同的数据集。在Jena TDB中每个拥有大约10-15个属性的120k资源。我想运行一些统计信息并检查属性在各个集合中的分布方式。
select ?property (count(?y) as ?count) where
{?x ?property ?y}
GROUP BY ?property
我尝试运行这个简单的查询,该查询应该为每个涉及属性?property 的三元组生成一个计数。
查询需要很长时间(5分钟以上)才能完成。有没有更好的方法(除了在forEach循环中计算 手动 )或任何微调ARQ / TDB的方法确实可以提高性能?