将选项卡分离格式化txt文件加载到Hbase中

时间:2017-04-25 08:31:53

标签: hadoop hbase

我正在尝试将标签分隔文件加载到hbase中。我得到了屏幕截图中提到的错误,请指教。

文件内容:

2   1/1/16 0:29 1/1/16 0:39
2   1/1/16 0:19 1/1/16 0:39
2   1/1/16 0:19 1/1/16 0:39
2   1/1/16 0:22 1/1/16 0:38
2   1/1/16 0:24 1/1/16 0:39
2   1/1/16 0:32 1/1/16 0:39

查询:

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns= HBASE_ROW_KEY,id,date:c1,date:c2 sample1 hdfs://localhost:9000/FinalProject/Hbase/samplehbase.txt

enter image description here

1 个答案:

答案 0 :(得分:1)

您不应在Importsv内执行hbase shell语句。

hbase(main)> create 'sample1', 'date'
-Dimporttsv.columns="HBASE_ROW_KEY,id,date:c1,date:c2"

sample1表只有一个列系列dateid不是列系列,请将其从columns中删除。

尝试,

~$ hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns="HBASE_ROW_KEY,date:c1,date:c2" sample1 hdfs://localhost:9000/FinalProject/Hbase/samplehbase.txt

在您的示例数据中,所有记录都具有相同的行键。在导入时,默认情况下,列系列中只有最后一行将作为VERSIONS => 1保留在表中。在运行导入之前,请考虑增加VERSIONS

hbase(main)> alter 'sample1',{NAME=>'date',VERSIONS=>6}