我需要处理存储在R中的Hadoop上的数据(某些群集和统计信息)。我之前使用Hive来分析数据。我找到了R的JDBC包,并希望使用它。但是,它不起作用,似乎很多罐子都不可用。你能提供一个好的指导或教程吗?如何从R中的Hive查询数据?
答案 0 :(得分:0)
你需要将Hive的罐子复制到你的R类路径并将它们加载到RJDBC。您可以在我的博客http://simpletoad.blogspot.com/2013/12/r-connection-to-hive.html
中阅读带有示例的详细信息答案 1 :(得分:0)
或者您有rhive包,可以使用以下命令
您只需使用RHIVE包
从R连接到hiveserver2即可以下是我使用过的命令。
Sys.setenv(HIVE_HOME="/usr/local/hive") Sys.setenv(HADOOP_HOME="/usr/local/hadoop") rhive.env(ALL=TRUE) rhive.init() rhive.connect("localhost")