解释并显示示例,为什么我们在sqoop中使用$ CONDITIONS

时间:2018-12-21 01:26:28

标签: sqoop

sqoop导入--connect jdbc:mysql:// localhost / retail_db-用户名root-密码cloudera-查询'从表名中选择* * $ CONDITIONS'

1 个答案:

答案 0 :(得分:0)

如果要并行导入查询的结果,则每个地图任务将需要执行查询的副本,并按Sqoop推断的边界条件对结果进行分区。您的查询必须包含令牌$ CONDITIONS,每个Sqoop进程将用唯一条件表达式替换该令牌。您还必须使用--split-by选择拆分列。

$ sqoop import \
--query 'SELECT a.*, b.* FROM a JOIN b on (a.id == b.id) WHERE $CONDITIONS' \
--split-by a.id 
--target-dir /user/foo/joinresults