从R连接到配置单元

时间:2014-05-01 22:40:16

标签: r hive

我需要处理存储在R中的Hadoop上的数据(某些群集和统计信息)。我之前使用Hive来分析数据。我找到了R的JDBC包,并希望使用它。但是,它不起作用,似乎很多罐子都不可用。你能提供一个好的指导或教程吗?如何从R中的Hive查询数据?

2 个答案:

答案 0 :(得分:0)

你需要将Hive的罐子复制到你的R类路径并将它们加载到RJDBC。您可以在我的博客http://simpletoad.blogspot.com/2013/12/r-connection-to-hive.html

中阅读带有示例的详细信息

答案 1 :(得分:0)

或者您有rhive包,可以使用以下命令

您只需使用RHIVE包

从R连接到hiveserver2即可

以下是我使用过的命令。

Sys.setenv(HIVE_HOME="/usr/local/hive") Sys.setenv(HADOOP_HOME="/usr/local/hadoop") rhive.env(ALL=TRUE) rhive.init() rhive.connect("localhost")