我在java中编写了一个适用于大数据的代码。我想将它分发给多台机器来处理部分数据并更快地完成处理。我之前从未参与过分布式计算。有没有工具来完成这项工作?感谢。
答案 0 :(得分:1)
Gridgain运作得相当好。 Hadoop是一个伟大的,但需要更多的开发。 Hazelcast可以成为一个好的局外人
我也可以引用其他人,但如果不知道涉及哪种类型的数据和处理,很难回答你的问题。进程是I / O密集型还是CPU绑定型?
其中一个问题是"您的数据集有多大?"。
答案 1 :(得分:0)
好像你想要做map-reduce算法。
Hadoop是一个开源项目,它提供了一个完全相同的框架。