这是一个愚蠢的问题,但有人不得不问它。
我尝试过本地运行Mahout,这很有用。现在,我希望工作由远程集群执行,而不是我的本地计算机。
那么,我应该在Hadoop机器上部署Mahout代码还是我仍然可以使用Hadoop远程在本地机器界面上制作Mahout?
答案 0 :(得分:2)
不,您不自行在Hadoop工作者上安装Hadoop程序。这将是一个维持的噩梦。当您通过hadoop jar
向所有代码提供JAR文件时,Hadoop会为您完成。
当您运行Mahout或其他任何基于Hadoop的本地计算机上运行的是一个客户端程序,它使用Hadoop代码将信息发送到群集以开始工作。该集群可能是本地集群,也可能是远程集群 - 对运行客户端的方式没有任何影响,只是客户端与之交谈。