来自两个输入文件的Talend筛选器

时间:2018-08-10 11:13:41

标签: talend business-intelligence

我有两个数据文件(定界文件):  -第一个包含3列,ID,num_phone,trafic_etl:SIM卡可以是3g,4g或其他任何内容。  -第二个包含1列num_phone_4g:SIM卡必须为4g。


问题是,我想用4g sim卡(第二个文件)填充一个数字为oracle的表,该表总共有0 trafic_etl,知道同一个num_phone的第一个文件可能有多个行。

我确实通过使用sql语句通过将文件存储在表中来做到这一点。 但是我要做的就是使用talend,而我对此工具还是陌生的。


谢谢。

两个文件的图像:File2 File1

1 个答案:

答案 0 :(得分:1)

这是使用此样本数据的解决方案。

*File 1*
num_phone;trafic_etl;annee;mois;jour
123456;111111;2018;Juillet;20
123457;222222;2018;Juillet;20
123458;0;2018;Juillet;20
123456;333333;2018;Juillet;20
123457;444444;2018;Juillet;20
123458;0;2018;Juillet;20

*File 2*
num_phone_4g
123456
123457
123458
123459

预期输出为123458(因为它总共有0流量)和123459(因为它在文件1中不存在;我不知道在您的用例中是否可行)。

enter image description here

我按电话号码汇总file2的数据,以获取每个电话号码的总流量(假设日期并不重要)。然后,我使用这些聚合数据作为对file2的查找。在tMap_1中,电话号码的2个流之间存在连接,并且我仅从file2中输出总流量为零或零的行。

enter image description here

让我知道我的假设是否正确。如果不是,我将更新我的答案。