我有这种格式的数据集
Column1:
Mumbai is a capital of MH
如果输入为Mumbai is of MH
,则与数据集sting匹配70%,以便将数据集记录添加到目标表中,如:
Target Table:
Column1:
Mumbai is a capital of MH
如果输入仅为Mumbai MH
,则匹配率低于70%,因此记录不会添加到目标表中。
使用Informatica可以实现这一目标吗?
答案 0 :(得分:0)
您需要将匹配的逻辑放入java转换中,然后使用过滤器转换仅允许记录通过足够高的分数。这与主数据管理非常相似,我也鼓励您查看Informatica MDM
答案 1 :(得分:0)
您可以将2个输入端口用于java转换: 输入1:“孟买是MH的首都” 输入2:“孟买是MH”
在java转换中,您可以使用split()函数拆分输入字符串,并将字符串存储在数组中。
在此之后,您可以逐字迭代Input2数组并检查该单词是否存在于Input1数组中。获得匹配记录后,您可以计算百分比。