我正在尝试建立Apache Mesos群集并在其上运行Hadoop-Job。文档here不属于我的水平,所以我无法理解,也许这里有人可以解释我:
首先我应该建立一个有效的Hadoop集群吗?或者首先建立一个Mesos集群? 我在哪里指向奴隶?在Hadoop-slaves文件中或只应使用注册的Mesos从属文件?
答案 0 :(得分:10)
Mesos的目标是为您的集群运行抽象,其中Hadoop只是其中一项服务。为了实现这一点,您需要首先将Mesos集群设置为主要组件,然后您可以使用Mesos抽象开始向此集群添加Hadoop等服务。
来自Mesosphere的an excellent tutorial你应该看一下,它详细解释了如何在Mesos之上运行Hadoop,所以这将是一个很好的起点。
或者,该公司最近开始为Elastic Mesos提供服务,其性质与亚马逊的Elastic MapReduce相似。因此,如果你想在Mesos上快速使用Hadoop而不必经历配置所有内容的痛苦,那么这是一个很好的起点。
答案 1 :(得分:3)
一旦你有一个mesos集群设置并运行,以便在Mesos WebUI中显示奴隶,你可以通过执行以下步骤为其添加hadoop:
如果您有任何疑问,也可以参考Mesosphere教程。只是不要遵循那里的所有步骤,因为它们不适用于最新的Mesos版本。