信息中的间接负载如何在内部工作。它是否整理所有数据然后处理数据,或者一次处理一个文件?如果我有跨越多个文件的重复项,我的映射中的重复删除逻辑是否会删除重复项,或者我是否必须使用Union转换合并文件,然后处理复制删除逻辑中的数据?
答案 0 :(得分:1)
据我所知,Informatica会像处理单个文件一样处理数据。所以是的,它应该删除文件中的重复项
答案 1 :(得分:1)
Informatica将流读取为单个文件。这就像你用通配符对文件名做cat
,例如。如果有两个文件f1.txt
里面有testlineA
而f2.txt
里面有testlineB
,而你运行cat f*.txt
命令,则应该得到:
testlineA
testlineB
就像是来自一个档案一样。
答案 2 :(得分:-1)
只要您的管道在实际过滤掉重复项之前有一个有效的转换(即分类器),那么所有记录都会在进入过滤器之前到达主动转换,并且事情将没有实际意义