Informatica中的间接负载

时间:2017-03-25 17:23:53

标签: etl informatica-powercenter flatfilesource

信息中的间接负载如何在内部工作。它是否整理所有数据然后处理数据,或者一次处理一个文件?如果我有跨越多个文件的重复项,我的映射中的重复删除逻辑是否会删除重复项,或者我是否必须使用Union转换合并文件,然后处理复制删除逻辑中的数据?

3 个答案:

答案 0 :(得分:1)

据我所知,Informatica会像处理单个文件一样处理数据。所以是的,它应该删除文件中的重复项

答案 1 :(得分:1)

Informatica将流读取为单个文件。这就像你用通配符对文件名做cat,例如。如果有两个文件f1.txt里面有testlineAf2.txt里面有testlineB,而你运行cat f*.txt命令,则应该得到:

testlineA
testlineB

就像是来自一个档案一样。

答案 2 :(得分:-1)

只要您的管道在实际过滤掉重复项之前有一个有效的转换(即分类器),那么所有记录都会在进入过滤器之前到达主动转换,并且事情将没有实际意义