标签: file talend
我有一个包含2列的文件:COMPANY_ID和ACTIVITY_ID。此文件与n:n关系表示公司的活动,例如:
COMPANY_ID
ACTIVITY_ID
n:n
1 | 1 1 | 2 2 | 2 2 | 3 2 | 4...
我有一个具有相同列但只有1:1关系的其他文件来表示公司的主要活动,例如:
1 | 1 2 | 3 3 | 1...
我的问题是:使用Talend,如何在第一个文件中删除使用第二个文件的每个公司的主要活动行,以仅保留其他活动?感谢。
答案 0 :(得分:1)
您可以通过在COMPANY_ID AND ACTIVITY_ID列上的两个文件之间进行INNER JOIN来实现此目的,并且只通过设置“Catch lookup inner join reject”来获取不匹配的行“在tMap输出:
tMap
输出:
|=---------+----------=| |COMPANY_ID|ACTIVITY_ID| |=---------+----------=| |1 |2 | |2 |2 | |2 |4 | '----------+-----------'
然后将此输出写入新文件。