对于一个拥有3200万行的表,Sqoop导入运行25个小时。

时间:2014-01-02 03:15:57

标签: jdbc sql-server-2008-r2 sqoop

我尝试了Sqoop一些包含30多万行的表,花了大约91241秒,完成地图任务大约需要25个小时。详情如下:

14/01/01 08:37:12 INFO mapreduce.ImportJobBase:在91,241.711秒内传输222.1807 GB(2.4935 MB /秒) 14/01/01 08:37:12 INFO mapreduce.ImportJobBase:检索到32419937条记录。

可能是什么问题,如何提高速度?

1 个答案:

答案 0 :(得分:0)

使用基于主键的sqoop导入表中的最小和最大限制范围,以便从单个表中进行多次导入。