sqoop在数据继续之间失败了什么

时间:2018-05-01 14:06:25

标签: sqoop

将数据导入RDBMS-HDFS时,Sqoop导入作业失败会发生什么情况,反之亦然?

1 个答案:

答案 0 :(得分:0)

Sqoop可以使用并行数据传输任务将数据从HDFS导出到RDBMS。每个任务都将打开与数据库的连接,通过事务插入数据库,并定期提交。这意味着在整个导出作业完成之前,数据库中将提供部分数据。

如果导出映射任务在多次重试后仍然失败,则整个作业将失败。任务失败的原因可能包括网络连接问题,数据库完整性约束,HDFS上的格式错误记录,群集容量问题等。在这种情况下,已提交的数据仍将在数据库中可用。