如何使用Pentaho替换表输入列中的邮件地址

时间:2017-03-14 13:43:12

标签: pentaho kettle

我对PDI很陌生,目前面临一个挑战,我必须将传入表格的电子邮件列中读取的邮件地址(由Kettle中的表格输入步骤提取)替换为其他邮件地址。

e.g。 user.test@example.com应该成为 abc [seq。数] @ example.com

目标是对传入的地址进行“匿名化”以进一步处理数据。

我目前没有解决方案,我希望你们有一个。 :-)

谢谢!

3 个答案:

答案 0 :(得分:0)

“转换”部分下面的“替换字符串”步骤完全符合您的情况。 不过,我建议你先阅读一些文档。

答案 1 :(得分:0)

我解决了。我只是花了很长时间才添加常量,序列和最终连接。

答案 2 :(得分:0)

您可以实现一个Java类,或者您可以执行以下操作,在表项之后创建一个序列,然后使用该步骤,拆分您处理邮件的行,将其作为分隔符@,在配置中步骤你创建两个字段,一个将包含电子邮件的初始部分,另一个包含域(例如gmail.com),然后获取您之前创建的序列的字段,将其与常量@连接(在拆分行丢失符号),并与域名连接,最后你会得到1 @ gmail.com,2 @ hotmail.com,ect.solo是4个步骤我希望它可以帮到你,问候