HBASE(导入数据)

时间:2014-03-29 12:03:14

标签: hadoop import hbase

我是hadoop和Hbase的新手。我有这样的数据

CustID,Trait,Count ABC,iav,3 ABC,xyz,3 BCD,IAV,4 BCD,叔,4

我希望通过API,批量导入(记录大小超过800 mil)或从PIG读取此数据,并将数据显示在Hbase中(转置)

CustId,iav,xyz,ter ABC,3,3,NULL BCD,4,NULL,4

数据在HDFS中。我该怎么做呢非常感谢您对此的指导。作为新人,我没能做多少。我主要是PIG,而且是一个人。

谢谢,

1 个答案:

答案 0 :(得分:0)

来自here

Hadoop生态系统包含许多子项目。 Hbase和Pig只是其中的一部分。

Hbase是Hadoop数据库,允许以表格方式管理数据,而不是文件方式。

Pig是一种脚本语言,它将在飞行映射中生成减少作业以获取所需的数据。与手写地图减少工作相比,它非常紧凑。