谁能告诉我练习Spark最好的方法是什么?我可以看到他们中的大多数指向安装Cloudera VM。我觉得很难处理它,因为我的系统只有6GB的RAM。这个过程非常慢,令我讨厌。 Cloudera Manger从未发布,我相信它因为它需要8GB的RAM。截至目前,我已经为我的Windows操作系统提供了3 GB,为我的VM提供了3 GB。有没有办法加快这个过程?或者我可以在Ubuntu中安装CDH然后使用spark吗? (我在我的机器上安装了Ubuntu,这样我就可以为linux分配完整的6GB)。或者我应该购买一台具有8 / 16GB RAM的新机器?
处理器:i5 560M 内存:6GB(5.6可用) VM:VMPlayer(VMware)
任何人都可以让我知道什么是好的配置?
答案 0 :(得分:0)
在6GB机器WINDOWS机器主机上用Hadoop练习Spark
遵循以下:
假设
然后使用单个节点(除了您的VM之外的任何东西)以独立模式安装Spark
希望这些有用:)