如何在MapReduce Job中通过python扫描HBase?

时间:2013-04-03 14:59:32

标签: python mapreduce hbase

我的mapreduce作业程序是由python编写的,我想从HBase获取数据作为输入。有没有办法以MapReduce方式扫描HBase表中的数据,例如本机Java实现中的TableMapper / Reducer。我了解到HappyBase可以提供一种与HBase交互的简单方法,但它只适用于客户端。

1 个答案:

答案 0 :(得分:1)

您可以编写一个从HBase获取数据的pig脚本,然后通过streaming集成python,或者如果您使用jython,则通过UDFs