我已经使用Cloudera Manager和CDH 5.4在集群系统上成功安装了Apache Hadoop(1个主服务器,2个具有基于Ubuntu的高配置的服务器)
我想将数据从Microsoft SQL服务器导入HBase(基于列的hadoop数据库),到目前为止,我已经从SQL服务器生成了CSV文件,并使用HBase Browser(Cloudera Manager中的Hue应用程序)将CSV导入HBase。
如果有任何方法可以直接将SQL服务器数据导入HBase,那对我有帮助,我听说过Sqoop应用程序已经完成了将数据从RDBMS导入Hadoop系统(即使我没试过这个,我想这会导入CSV文件到Hadoop系统不在HBase中)
如果上述情况有任何可行的方法,请告诉我。
答案 0 :(得分:1)
Sqoop支持使用sqoop命令中的--hbase-table选项将数据直接导入HBASE。
https://sqoop.apache.org/docs/1.4.2/SqoopUserGuide.html#_importing_data_into_hbase