将数据从MySQL导入Hadoop Hive时,我需要在Hive创建的新表中添加额外的“timestamp”字段。
Input: MySQL table fields : Name, e-nmail, address
Output: Hive table fileds : Name, e-nmail, address, timestamp
问题:
答案 0 :(得分:0)
您可以使用Sqoop中的--query参数自定义从RDBMS中选择的数据。您的命令可能如下所示:
sqoop import \
--connect jdbc:mysql://host:port/db \
--query 'SELECT name, email, address, NOW() AS timestamp FROM table WHERE $CONDITIONS' \
--split-by name \
--hive-import \
--hive-table table \
--target-dir location