我想通过sqoop将输入数据从hdfs导出到postgress db。 当我的输入数据与postgress表格格式正确时,我能够实现这一点。
但是我想在输入数据之前对输入数据执行一些操作,比如说我想在我把它添加之前为每个值添加一些no。
所以,sqoop是否提供任何此类api来实现这一点..
sqoop版本:1.4.6
答案 0 :(得分:1)
Sqoop在导出时不支持任何操作。它只是将export-dir作为输入。您可以使用pig / hive对导入的数据执行某些操作,并且可以将输出数据集导出回您的postgress db。