如何使用sqoop在摄取数据时屏蔽数据

时间:2016-05-09 05:48:02

标签: hadoop sqoop hadoop2 sqoop2 data-masking

我正在使用sqoop提取数据。有没有办法屏蔽sqoop中的任何特定列或修改每个单元格。 例如:

creditcardinfo
7888-3333-2222-1002
1111-2342-1235-2090
2331-2131-2222-3421   

我希望数据在摄取后像:

creditcardinfo
XXXX-XXXX-XXXX-1002
XXXX-XXXX-XXXX-2090
XXXX-XXXX-XXXX-3421   

creditcardinfo
1002
2090
3421  

是否有可能在sqoop?我试图找出但无法获得太多信息。

1 个答案:

答案 0 :(得分:1)

最简单的方法是使用自定义查询来获取sqoop,在自定义查询中,您可以执行所需的所有转换。您可以在此处查看以供参考:https://sqoop.apache.org/docs/1.4.1-incubating/SqoopUserGuide.html#_free_form_query_imports