将数据从HDFS导出到MySQL,但是在进入MySQL之前应先更新数据

时间:2018-12-26 12:17:12

标签: mysql hadoop sqoop

我需要将数据从MySQL导入到HDFS,而我正在使用Apache Sqoop。但问题是,我还需要将数据从HDFS导出到MySQL,并且需要在将数据移至MySQL之前更新这些数据的一列(即HDFS中的数据),我该怎么做?

1 个答案:

答案 0 :(得分:1)

您可以直接从hdfs更新该列,并可以使用INSER OVERWRITE DIRECTORY“ path”将配置单元输出存储到HDFS,然后使用以下sqoop命令

 sqoop export \
--connect jdbc:mysql://master/poc \
--username root \
--table employee \
--export-dir /user/hdfs/mysql/export.txt \
--update-key id \
--update-mode allowinsert \
--fields-terminated-by '\t' \
-m 1

希望这会有所帮助。