创建具有多个列族的基表

时间:2017-05-14 16:24:05

标签: hadoop hbase

我是hbase的新手。我在Microsoft Azure上使用HBase版本1.1.2。我的数据看起来像这样

id  num1  rating
 1   254      2
 2    40      3
 3    83      1
 4   120      1
 5    91      5
 6   101      2
 7    17      1
 8    10      2
 9    11      3
10    31      1

我尝试使用表格

的两个列系列创建一个表
create 'table1', 'family1', 'family2'

当我加载我的桌子时

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv \
-Dimporttsv.columns="HBASE_ROW_KEY,family1:num1, family2:rating" table1 /metric.csv

我收到了错误

Error: org.apache.hadoop.hbase.client.RetriesExhaustedWithDetailsException: Failed 5560 actions: org.apache.hadoop.hbase.regionserver.NoSuchColumnFamilyException: Column family family2 does not exist in region table1

当我用一个列族修改我的表时,它工作了

create 'table1', 'family1'



hbase org.apache.hadoop.hbase.mapreduce.ImportTsv \
-Dimporttsv.columns="HBASE_ROW_KEY,family1:num1, family1:rating" table1 /metric.csv

如何调整表格创建以考虑多个列族?

1 个答案:

答案 0 :(得分:-1)

HBase ImportTsv在内部使用PUT操作将数据加载到HBase表中。

PUT仅支持一次加载到单列族 Here HereDocumentation