我在Hbase中有一个表,它有超过2000行,它包含二进制格式的数据。请将它加载到pig中并使用PIG对其进行一些数据处理
示例hbase表数据: -
ROW COLUMN+CELL
\x00\x00\x00\x00\x00\x00\x06\xA6 column=cd:cct, timestamp=1475738991531, value=Atlanta
\x00\x00\x00\x00\x00\x00\x06\xA6 column=cd:cnt, timestamp=1475740226346, value=Network ICE Corp.
\x00\x00\x00\x00\x00\x00\x06\xA6 column=cd:ct, timestamp=1475740596684, value=ISYI srl
我已经尝试过如此提到的 HBaseStorage using Pig链接
命令: -
C = load ‘hbase://companydetail’
using org.apache.pig.backend.hadoop.hbase.HBaseStorage('cd', '-loadKey true')
as (rowkey:bytearray, cd:map[]);
但是因为它里面有很多二进制数据,给出了很多奇怪的符号,这些符号是无法读懂和理解的。
示例输出: -
(�$f,[parent_ccnt#United States,parent_cid#
/�,p
我尝试过使用binaryconverter的另一种方法
a = load 'hbase://tablename' using org.apache.pig.backend.hadoop.hbase.HBaseStorage('cd','-loadKey -caster HBaseBinaryConverter') as (rowKey:bytearray,cd:map[]);
但仍然与上面的示例输出相同。 在我的表中,它包含超过42列的cd列系列。 在那42列中,有很多二进制格式的数据。
请建议我如何将二进制数据读入猪。
任何帮助都很明显。
谢谢,
Mohan.V