我正在评估多个大数据工具。其中一个当然是Impala 我想通过手动启动集群节点上的进程来启动Impala集群。正如我目前正在为Spark,H2O,Presto和Dask做的那样,我想抓住二进制文件,复制到节点,编辑配置,并从shell启动节点上的服务。这非常有效,升级很简单,我可以在需要时轻松移动到更大/不同的集群。不幸的是,我找不到从shell启动所需服务(Catalog Server,StateStore和daemon)的正确方法的资源 我认为这是明显的任务但是找不到合适的示例,所以我的问题是如何从shell调用Impala二进制文件启动Impala集群?
答案 0 :(得分:2)
....我想通过手动启动集群节点上的进程来启动Impala集群.....如何从shell调用Impala二进制文件启动Impala集群?
我想这就是你要找的东西: http://www.cloudera.com/documentation/enterprise/5-5-x/topics/impala_processes.html#starting_via_cmdline
更新1:
您可能只想从此链接中选择所需信息:http://doc.mapr.com/plugins/servlet/mobile#content/view/28869628
它有从github构建impala的步骤,可以在mapr上运行。
更新2:
要构建Impala,请检查以下链接: https://github.com/cloudera/Impala/wiki/Build-prerequisites https://github.com/cloudera/Impala/wiki/How-to-build-Impala https://cwiki.apache.org/confluence/display/IMPALA/Building+Impala
更新3:
有关便携性的专家建议,请与我们联系:
Impala开发人员:dev@impala.incubator.apache.org
取自http://impala.apache.org/community.html
暂时,你可以考虑为现成的linux生产环境构建二进制文件。
更适合您情况的链接:
https://cwiki.apache.org/confluence/display/IMPALA/Tips+for+Faster+Impala+Builds https://cwiki.apache.org/confluence/display/IMPALA/Building+native-toolchain+from+scratch+and+using+with+Impala