R / Rstudio中的Hive连接器

时间:2015-10-27 09:00:31

标签: r hadoop hive shiny rstudio

有人知道是否可以将Hadoop与R / Rstudio连接?如果是的话,怎么样?

我有一些蜂巢桌,我想用R / Rstudio来识别它们,并在'闪亮'中进行视觉恢复(图表等等)。

我将不胜感激任何帮助(想法,代码示例......)。

2 个答案:

答案 0 :(得分:0)

试用套餐dplyr.hive.spark。文档仍然更适合火花,但我用最新的HDP沙箱对Hive进行了测试,事情进展顺利。如果您试一试,请报告任何问题。

答案 1 :(得分:0)

如果您只想访问HDFS上的hive表,可以使用RJDBC包和JDBC连接(在此处解释:https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients#HiveServer2Clients-JDBC)。然后你可以像使用关系数据库一样使用RJDBC,除了它可能会在你的集群上启动一些map / reduce作业来执行。