我有两个数据文件(定界文件): -第一个包含3列,ID,num_phone,trafic_etl:SIM卡可以是3g,4g或其他任何内容。 -第二个包含1列num_phone_4g:SIM卡必须为4g。
问题是,我想用4g sim卡(第二个文件)填充一个数字为oracle的表,该表总共有0 trafic_etl,知道同一个num_phone的第一个文件可能有多个行。
我确实通过使用sql语句通过将文件存储在表中来做到这一点。 但是我要做的就是使用talend,而我对此工具还是陌生的。
谢谢。
答案 0 :(得分:1)
这是使用此样本数据的解决方案。
*File 1*
num_phone;trafic_etl;annee;mois;jour
123456;111111;2018;Juillet;20
123457;222222;2018;Juillet;20
123458;0;2018;Juillet;20
123456;333333;2018;Juillet;20
123457;444444;2018;Juillet;20
123458;0;2018;Juillet;20
*File 2*
num_phone_4g
123456
123457
123458
123459
预期输出为123458(因为它总共有0流量)和123459(因为它在文件1中不存在;我不知道在您的用例中是否可行)。
我按电话号码汇总file2的数据,以获取每个电话号码的总流量(假设日期并不重要)。然后,我使用这些聚合数据作为对file2的查找。在tMap_1
中,电话号码的2个流之间存在连接,并且我仅从file2中输出总流量为零或零的行。
让我知道我的假设是否正确。如果不是,我将更新我的答案。