如何通过Sqoop从多个源导入数据

时间:2016-01-23 17:37:32

标签: hadoop sqoop

"如何通过Sqoop"从多个来源导入数据。

我对此没有任何想法。请告诉我这个机制。

由于

1 个答案:

答案 0 :(得分:4)

这可以通过shell脚本完成。

1)准备一个包含DBNAME.TABLENAME列表的输入文件2)shell脚本将此文件作为输入,逐行迭代并为每一行执行sqoop语句。

while read line;
do

    DBNAME=`echo $line | cut -d'.' -f1` 
    tableName=`echo $line | cut -d'.' -f2`


    sqoop import -Dmapreduce.job.queuename=$RM_QUEUE_NAME --connect '$JDBC_URL;databaseName=$DBNAME;username=$USERNAME;password=$PASSWORD' --table $tableName  --target-dir $DATA_COLLECTOR/$tableName  --fields-terminated-by '\001'  -m 1 

done<inputFile