SQOOP:在导出到postgress DB之前自定义输入数据

时间:2017-01-18 09:16:43

标签: hive hadoop2 sqoop sqoop2

我想通过sqoop将输入数据从hdfs导出到postgress db。 当我的输入数据与postgress表格格式正确时,我能够实现这一点。

但是我想在输入数据之前对输入数据执行一些操作,比如说我想在我把它添加之前为每个值添加一些no。

所以,sqoop是否提供任何此类api来实现这一点..

sqoop版本:1.4.6

1 个答案:

答案 0 :(得分:1)

Sqoop在导出时不支持任何操作。它只是将export-dir作为输入。您可以使用pig / hive对导入的数据执行某些操作,并且可以将输出数据集导出回您的postgress db。