如何使用sqoop从HDFS导入并在导入时组合表的两列?

时间:2014-06-04 11:13:57

标签: hadoop hdfs sqoop sqoop2

我可以在导入或导出时组合两个或更多列,假设我在DBMS ID,FIRST_NAME,LAST_NAME中有3列,我想将其加载为ID,NAME只有两列。那我怎么能这样做呢?

2 个答案:

答案 0 :(得分:3)

尝试以下选项

sqoop import --connect <db server> --username <user> --password <password> --query "select ID,CONCAT(FIRST_NAME,LAST_NAME) from table" --target-dir <hdfs directory>

由于您已经提到了我的数据库和表名,因此我使用通用形式编写。

答案 1 :(得分:0)

感谢srinivasan得到了解决方案

sqoop import --connect <db server> --username <user> --password <password> --query "select ID,concat(FIRST_NAME,LAST_NAME) from table" --target-dir <hdfs directory>