如何在EMR上安装cloudera impala?

时间:2013-06-18 09:13:18

标签: hadoop hive cloudera amazon-emr impala

无论如何,我可以在没有cloudera经理且没有cdh的情况下安装唯一的impala。我将使用hadoop的apache版本?

3 个答案:

答案 0 :(得分:1)

是的,绝对有可能。将存储库添加到sources.list文件中,然后更新存储库。

  

deb [arch = amd64]   http://archive.cloudera.com/impala/ubuntu/precise/amd64/impala   exact-impala1 contrib deb-src   http://archive.cloudera.com/impala/ubuntu/precise/amd64/impala   exact-impala1 contrib

之后,它只是:

sudo apt-get install impala                (Binaries for daemons)
sudo apt-get install impala-server         (Service start/stop script)
sudo apt-get install impala-state-store    (Service start/stop script)

但不要忘记满足所有先决条件。有关详细信息,请访问here

答案 1 :(得分:1)

您可以在此处查看有关如何在Amazon EMR中安装和使用Impala的详细说明:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-impala.html

答案 2 :(得分:0)

EMR基于在Debian挤压之上运行的Amazon Hadoop发行版。所以,是的,可以使用Cloudera的DEB回购。

您需要通过SSH连接到您的EMR主节点,在EMR控制台上找到该地址。

如果您打算使用外部世界的JDBC / ODBC客户端连接到Impala,您还需要在已分配给EMR群集的安全组上启用安全规则。