将数据导入RDBMS-HDFS时,Sqoop导入作业失败会发生什么情况,反之亦然?
答案 0 :(得分:0)
Sqoop
可以使用并行数据传输任务将数据从HDFS
导出到RDBMS
。每个任务都将打开与数据库的连接,通过事务插入数据库,并定期提交。这意味着在整个导出作业完成之前,数据库中将提供部分数据。
如果导出映射任务在多次重试后仍然失败,则整个作业将失败。任务失败的原因可能包括网络连接问题,数据库完整性约束,HDFS
上的格式错误记录,群集容量问题等。在这种情况下,已提交的数据仍将在数据库中可用。