标签: distributed accumulo
我是累积的新手,并有一个新手问题。
我有几个独立的远程累积实例。我想同时在所有实例上运行单个查询并聚合结果。这样做有图书馆或标准方法/最佳做法吗?
THX
答案 0 :(得分:0)
没有Accumulo推荐的方法来做到这一点。就像你认为它们是独立的集群一样,我们也会认为它们是独立的,并依赖于你(用户)来汇总你从每个集群查询的数据。鉴于Scanners和BatchScanner公开迭代器,合并每个迭代器的结果非常简单(Guava的迭代器类可能会有帮助)。