使用Importtsv将csv文件加载到Hbase

时间:2017-07-25 04:05:44

标签: csv hbase hdfs bigdata

我正在尝试使用Importtsv将csv文件加载到Hbase。

我已将customers1.csv上传到hdfs,使用命令

创建了一个名为t1的hbase表
hbase(main):001:0> create 't1','FirstName','LastName'

当我尝试通过运行命令将csv数据加载到hbase表t1时

hbase(main):010:0> hbase org.apache.hadoop.hbase.mapreduce.ImportTsv-Dimporttsv.separator=',' -Dimporttsv.columns='HBASE_ROW_KEY,FirstName,LastName' t1 hdfs://my.cluster.com/user/maapr/test/customers1.csv

由于以下原因导致数据无法加载:

SyntaxError: (hbase):10: syntax error, unexpected tIDENTIFIER

我遵循在线研究的语法,但我仍然遇到这种语法错误。知道发生了什么事吗?非常感谢您的解决方案。

另一个愚蠢的问题。除了Importtsv之外,还有其他方法可以将数据从HDFS加载到Hbase吗?感谢。

1 个答案:

答案 0 :(得分:1)

您正在从 HBase shell 运行批量加载命令。从HBase shell出来并尝试.. :))

此部分需要空间:ImportTsv -Dimporttsv.separator =','

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.separator=',' -Dimporttsv.columns='HBASE_ROW_KEY,FirstName,LastName' t1 hdfs://my.cluster.comser/maapr/test/customers1.csv

对于批量加载,您还可以编写自定义MR 作业。 我正在为Phoenix HBase表使用 Apache Phoenix批量加载工具