我正在尝试使用AWS上的R连接到运行Cloudera hadoop的群集。按照此处提到的步骤进行操作 - http://blog.cloudera.com/blog/2013/12/how-to-do-statistical-analysis-with-impala-and-r/
到目前为止,我可以启动jdbc驱动程序,但无法连接到impala。
从某些调查中,我可以看到impala守护程序在我们所有的工作节点中运行。端口配置如下。
此外,我登录到其中一个工作节点并检查正在侦听的端口。我可以看到端口21050正在侦听,在这里,
这里在rimpala connect中,我使用的是工作节点的公共IP。仍然无法连接到那个。我可以使用公共IP和端口25000来查看impala web UI,但无法连接到此端口侦听jdbc请求。任何人都可以帮助我吗?
答案 0 :(得分:0)
如果有人正在寻求帮助,这是我从Cloudera支持得到的答案。
“问题不在于Impala或Cloudera发行版。问题 与“Rimpala”使用的驱动程序。 RImapla正在使用HIVE JDBC 驱动程序。如果你检查源代码 https://github.com/Mu-Sigma/RImpala/blob/master/java/src/main/java/com/musigma/ird/bigdata/RImpala.java 你会看到被用作驱动器的调用是 “org.apache.hive.jdbc.HiveDriver”。所以理想的RImpala包是 过时了,它没有更新工作。“