使用虚拟机为大数据创建集群?

时间:2016-02-23 19:29:01

标签: apache-spark hdfs virtual-machine virtualbox bigdata

是否可以在虚拟机(VirtualBox)上创建具有多个节点(4或5)的群集,并运行Apache Spark来分析节点内的数据?集群的设计符合HDFS的风格,但不使用HDFS。如果可能,您将如何跨节点分发数据?该项目的想法是展示水平缩放的工作原理。

1 个答案:

答案 0 :(得分:2)

我希望this articlethis updated github project为您效劳。