标签: apache-spark hdfs virtual-machine virtualbox bigdata
是否可以在虚拟机(VirtualBox)上创建具有多个节点(4或5)的群集,并运行Apache Spark来分析节点内的数据?集群的设计符合HDFS的风格,但不使用HDFS。如果可能,您将如何跨节点分发数据?该项目的想法是展示水平缩放的工作原理。
答案 0 :(得分:2)
我希望this article和this updated github project为您效劳。