将Tab键分隔的键值数据加载到Hadoop中

时间:2016-08-24 13:56:57

标签: hadoop hive hbase apache-pig

是否有一种很好的方法来加载键值对,制表符分隔数据,其中每一行都有不同的键,具体取决于其中一个键的值?

数据示例:

type:A     field1:valueA1     field2:valueA2     field3:valueA3   
type:A     field1:valueA1     field2:valueA2     field3:valueA3
type:B     field1:valueB1     field4:valueB4

任何猪,蜂巢或HBase解决方案将不胜感激。感谢。

1 个答案:

答案 0 :(得分:0)

您可以将类型存储在不同的HBase列名称中,将字段:值对存储为hbase行。 (唯一字段键:值)