如何使用sqoop命令在多个环境中保存数据

时间:2018-05-25 09:27:42

标签: sqoop sqoop2

我需要一次在HDFS和AWS S3中保​​存数据。我使用了以下命令,但只有第一条路径正在工作。

sqoop import -D mapreduce.job.name=XXX-D mapred.job.queue.name=XX -Dhadoop.security.credential.provider.path=<path> -Dfs.s3a.server-side-encryption-algorithm=####--options-file <path> --query "select cols from DB.Table where UPDATETIME between to_date('2015-09-11 00:00:00','yyyy/mm/dd hh24:mi:ss') and to_date('2018-05-24 04:28:16','yyyy/mm/dd hh24:mi:ss') and \$CONDITIONS" --hive-delims-replacement ' ' --direct --m 1 --split-by ID --target-dir <S3 path> --target-dir <hdfs path> 

1 个答案:

答案 0 :(得分:0)

Sqoop不支持多个目标。您可以尝试两步法:

  1. SqoopDB导入HDFS
  2. distcpHDFSAmazon S3