我在azure中有两个集群,一个用于spark 2.0,另一个用于hbase。我可以完美地填充和使用hbase,现在我想将火花连接到hbase并进行一些计算。我想使用python,因为我不知道scala。
我的第一个问题是:最好的方法是什么? spark - >蜂巢 - > hbase还是直接火花到hbase?
我可以有一个很好的插入和查询示例吗?
感谢?
答案 0 :(得分:0)
如果您通过Spark-to-HBase连接器直接使用Spark到HBase,Zhan Zhang在http://hortonworks.com/blog/spark-hbase-dataframe-based-hbase-connector/提供了一个非常好的博客文章,提供示例。
HTH!