分布式数字总和

时间:2015-10-09 06:53:09

标签: apache-spark distributed-computing apache-zookeeper

我有一组在不同计算机上运行的Web应用程序,这些计算机具有一组指标。我希望每台机器的每个指标都有一个运行总和。这些累积指标将在以后使用。因此,应该坚持,比如每天。我该如何处理?使用Spark中的Accumulator变量很容易做到这一点。但Spark无法安装在这些机器上。

我认为这也应该可以通过Zookeeper实现。但是,怎么样?

1 个答案:

答案 0 :(得分:0)

我继续使用它:

http://netflix.github.io/curator/doc/com/netflix/curator/framework/recipes/atomic/DistributedAtomicLong.html

Distributed Atomic Long中的

Netflix curator食谱。