hadoop集群的所有数据节点上的Apache DrillBit服务

时间:2016-02-17 10:31:40

标签: hadoop apache-drill

我正在使用10节点的hadoop集群,如下所示:

  • 1 - NameNode
  • 1 - ResourceManager
  • 8 - 数据节点

我的复制因子设置为3。

我计划使用Apache Drill来查询hadoop数据。

是否需要在所有节点上安装drillbit,还是只能在3个节点上安装?

提前致谢。

1 个答案:

答案 0 :(得分:1)

您可以根据需要在任意数量的节点上安装它。

在分布式模式下运行“钻取”时,请确保 -

  • Zookeeper正在群集上运行

  • 修改drill-override.conf

      drill.exec:{
        cluster-id: "<mydrillcluster>",
        zk.connect: "<zkhostname1>:<port>,<zkhostname2>:<port>, <zkhostname3>:<port>"
       }
    

    所有节点(运行钻取的 )必须具有相同的 cluster-id

  • 首先需要在群集中的每个节点上启动Drill守护程序(Drillbit)。

参考: