hadoop如何处理从RDBMS中提取的行的更改

时间:2013-04-11 00:37:41

标签: mysql hadoop mapreduce hdfs sqoop

我有一个场景,每天从MYSQL数据库中将数据摄入hadoop到一个过时的文件夹。每天都会编辑很少的行,也可能会有一些架构更改。如果我只对最新的数据和模式感兴趣,我们如何在hadoop中处理这个问题

1 个答案:

答案 0 :(得分:0)

Here是Sqoop中增量导入的文档。此外,Sqoop可以在导入数据时获取表名,因此如果模式更改,则Sqoop命令应该相同。

  

bin / sqoop import --connect jdbc:mysql:// localhost / bigdata --table widgets -m 1