有没有办法在使用sqoop将数据提取到hbase之前处理sql表列中的数据

时间:2018-07-16 12:27:36

标签: hadoop hbase sqoop

需要使用sqoop将

数据从sql表提取到hbase。我在一列中包含xml数据。而不是为每一行摄取完整的xml,我想从xml中获取详细信息,然后与其余的列一起摄取。有没有像编写UDF那样传递xml列并使用输出和其他sql列一起提取的方式。

1 个答案:

答案 0 :(得分:0)

否,但是您可以扩展Java类PutTransformer(https://sqoop.apache.org/docs/1.4.4/SqoopDevGuide.html),在其中添加XML转换逻辑,然后将自定义JAR文件传递给sqoop命令。