sqoop导入--connect jdbc:mysql:// localhost / retail_db-用户名root-密码cloudera-查询'从表名中选择* * $ CONDITIONS'
答案 0 :(得分:0)
如果要并行导入查询的结果,则每个地图任务将需要执行查询的副本,并按Sqoop推断的边界条件对结果进行分区。您的查询必须包含令牌$ CONDITIONS,每个Sqoop进程将用唯一条件表达式替换该令牌。您还必须使用--split-by选择拆分列。
$ sqoop import \
--query 'SELECT a.*, b.* FROM a JOIN b on (a.id == b.id) WHERE $CONDITIONS' \
--split-by a.id
--target-dir /user/foo/joinresults