如何转换hbase二进制foramtted数据并将其加载到Pig?

时间:2016-12-21 09:32:14

标签: hbase apache-pig

我在Hbase中有一个表,它有超过2000行,它包含二进制格式的数据。请将它加载到pig中并使用PIG对其进行一些数据处理

示例hbase表数据: -

ROW                              COLUMN+CELL

\x00\x00\x00\x00\x00\x00\x06\xA6 column=cd:cct, timestamp=1475738991531, value=Atlanta

\x00\x00\x00\x00\x00\x00\x06\xA6 column=cd:cnt, timestamp=1475740226346, value=Network ICE Corp.

\x00\x00\x00\x00\x00\x00\x06\xA6 column=cd:ct, timestamp=1475740596684, value=ISYI srl

我已经尝试过如此提到的 HBaseStorage using Pig链接

命令: -

C = load ‘hbase://companydetail’
   using org.apache.pig.backend.hadoop.hbase.HBaseStorage('cd', '-loadKey true')
   as (rowkey:bytearray, cd:map[]);

但是因为它里面有很多二进制数据,给出了很多奇怪的符号,这些符号是无法读懂和理解的。

示例输出: -

(�$f,[parent_ccnt#United States,parent_cid#
                                            /�,p

我尝试过使用binaryconverter的另一种方法

a = load 'hbase://tablename' using org.apache.pig.backend.hadoop.hbase.HBaseStorage('cd','-loadKey -caster HBaseBinaryConverter') as (rowKey:bytearray,cd:map[]);

但仍然与上面的示例输出相同。 在我的表中,它包含超过42列的cd列系列。 在那42列中,有很多二进制格式的数据。

请建议我如何将二进制数据读入猪。

任何帮助都很明显。

谢谢,

Mohan.V

0 个答案:

没有答案