我一直在学习用于存储数据和在n维空间中执行范围计数的k-d树。我想知道是否有其他数据结构可以很好地计算沿着某些尺寸的唯一值。因此,例如,假设我有一些看起来像的购买数据:
{ "name" : "Bill", "paid_amount" : 10.00 }
{ "name" : "Anne", "paid_amount" : 3.00 }
{ "name" : "Carl", "paid_amount" : 15.00 }
{ "name" : "Bill", "paid_amount" : 8.00 }
...
我想知道有多少人(例如唯一的“姓名”)购买了大于10.任何想法?
答案 0 :(得分:0)
这是一篇关于efficient data structures for unique counting的文章(以及尺寸和准确性的权衡)。
StreamLib的来源,文档和相当活跃的邮件列表也是一个很好的资源。