如何比较单词,如果匹配百分比超过70%,则使用Informatica将这些记录加载到目标中

时间:2017-09-02 13:14:46

标签: etl informatica informatica-powercenter

我有这种格式的数据集

Column1: 
Mumbai is a capital of MH

如果输入为Mumbai is of MH,则与数据集sting匹配70%,以便将数据集记录添加到目标表中,如:

Target Table:
Column1: 
Mumbai is a capital of MH

如果输入仅为Mumbai MH,则匹配率低于70%,因此记录会添加到目标表中。

使用Informatica可以实现这一目标吗?

2 个答案:

答案 0 :(得分:0)

您需要将匹配的逻辑放入java转换中,然后使用过滤器转换仅允许记录通过足够高的分数。这与主数据管理非常相似,我也鼓励您查看Informatica MDM

答案 1 :(得分:0)

您可以将2个输入端口用于java转换: 输入1:“孟买是MH的首都” 输入2:“孟买是MH”

在java转换中,您可以使用split()函数拆分输入字符串,并将字符串存储在数组中。

在此之后,您可以逐字迭代Input2数组并检查该单词是否存在于Input1数组中。获得匹配记录后,您可以计算百分比。