我想基于Hadoop安装Apache HAWQ。
在安装HAWQ之前,我应该安装Hadoop并配置我的所有节点。
我有四个节点如下,我的问题就是打击。
我应该为hawq-master
安装hadoop发行版吗?
1. hadoop-master //namenode, Secondary Namenode, ResourceManager, HAWQ Standby,
2. hawq-master //HAWQ Master
3. datanode01 //Datanode, HAWQ Segment
4. datanode02 //Datanode, HAWQ Segment
我在节点旁边写了每个节点的角色,如上所述。
在我看来,我应该为hadoop-master
,datanode01
和datanode02
安装hadoop,我应该将hadoop-master
设置为namenode(master),将其他设置为datanode
(奴隶)。然后,我将在所有节点上安装apache HAWQ。我将hawq-master
设置为主节点,将hadoop-master
设置为HAWQ待机,最后将其他两个节点设置为HAWQ段。
我想要的是安装基于Hadoop的HAWQ。所以,我认为hawq-master
应该建立在hadoop之上,但与hadoop-master
没有关系。
如果我继续执行上述程序,那么我认为我不必在hawq-master
上安装hadoop发行版。我是否认为能够成功安装基于hadoop的HAWQ安装?
如果应在hawq-master
安装hadoop,那么哪一个是正确的?
1. `hawq-master` should be set as `namenode` .
2. `hawq-master` should be set as 'datanode`.
任何帮助将不胜感激。
答案 0 :(得分:4)
老实说,如果正确配置hadoop安装和hawq安装方式没有严格限制。
为了您的关注,“我认为hawq-master应该建立在hadoop之上,但与hadoop-master没有关系”。 IMO,它应该是“hawq应该建立在hadoop之上”。我们配置了hawq-master conf文件(hawq-site.xml)以使hawq与hadoop建立连接。
通常,对于hawq master和hadoop master,我们可以在一个节点上安装每个组件,但我们可以在一个节点上安装其中一些以节省节点。但对于HDFS datanode和HAWQ细分市场,我们经常将它们安装在一起。考虑到每台机器的工作量,我们可以按如下方式安装它们:
hadoop hawq
hadoop-master namenode hawq standby
hawq-master secondarynamenode hawq master
other node datanode segment
如果使用yarn集成配置hawq,则集群中将有resourcemanager和nodemanager。
hadoop role hawq role
hadoop-master namenode hawq standby
hawq-master snamenode,resourcemanager hawq master
other node datanode, nodemanager segment
将它们安装在一起并不意味着它们具有连接,它是您的配置文件,使它们可以相互连接。 您可以将所有主组件安装在一起,但机器可能太重。在http://incubator.apache.org/projects/hawq.html阅读有关Apache HAWQ的更多信息,并阅读http://hdb.docs.pivotal.io/211/hdb/index.html处的一些文档。
此外,您可以订阅开发者和用户邮件列表,发送电子邮件至dev-subscribe@hawq.incubator.apache.org/user-subscribe@hawq.incubator.apache.org订阅并发送电子邮件至dev @hawq .incubator.apache.org / user@hawq.incubator.apache.org提问。