我正在使用10节点的hadoop集群,如下所示:
我的复制因子设置为3。
我计划使用Apache Drill来查询hadoop数据。
是否需要在所有节点上安装drillbit,还是只能在3个节点上安装?
提前致谢。
答案 0 :(得分:1)
您可以根据需要在任意数量的节点上安装它。
在分布式模式下运行“钻取”时,请确保 -
Zookeeper正在群集上运行
修改drill-override.conf
:
drill.exec:{
cluster-id: "<mydrillcluster>",
zk.connect: "<zkhostname1>:<port>,<zkhostname2>:<port>, <zkhostname3>:<port>"
}
所有节点(运行钻取的 )必须具有相同的 cluster-id 。
首先需要在群集中的每个节点上启动Drill守护程序(Drillbit)。
参考: