应用错误收集

如何从pyspark连接到hbase

时间：2016-11-10 14:24:58

标签： python apache-spark hbase pyspark

我在azure中有两个集群，一个用于spark 2.0，另一个用于hbase。我可以完美地填充和使用hbase，现在我想将火花连接到hbase并进行一些计算。我想使用python，因为我不知道scala。

我的第一个问题是：最好的方法是什么？ spark - ＆gt;蜂巢 - ＆gt; hbase还是直接火花到hbase？

我可以有一个很好的插入和查询示例吗？

感谢？

1 个答案:

答案 0 :(得分：0)

如果您通过Spark-to-HBase连接器直接使用Spark到HBase，Zhan Zhang在http://hortonworks.com/blog/spark-hbase-dataframe-based-hbase-connector/提供了一个非常好的博客文章，提供示例。

HTH！