Hive表连接更新

时间:2015-10-29 17:32:23

标签: sql hadoop hive hql jointable

我有点卡住,任何人都可以帮助我。我有两张具有以下结构的表格。

Table 1
Id String
Code1 String
Code2 String

Table 2
Id String
UserCode String
UniversalCode String

我需要做的是用表2中的UniversalCode替换code1和code2中的所有值。更清楚的是,如果code1与UserCode匹配,则使用universalCode重新编写Code1,如果code2与usercode匹配则再次使用相同的记录用UniversalCode替换它。如果没有匹配,则保留code1和code2的值。我需要从表1中获得所有记录。表1和表2通过Id连接。

我尝试了下面的一个专栏,但卡住了添加code2

SELECT 
Id,
CASE WHEN a.Code1 = b.UserCode then b.UniversalCode else a.Code1 end
from table1 a
LEFT OUTER JOIN table2 b ON (a.Id = b.Id and a.code1 = b.UserCode);

有任何建议要完成这项工作吗? ,真实场景有5-6列,我需要应用相同的逻辑。

Test Data 

Table 1
1,123,ABCD
1,ABCD,123
1,456,BCD
1,BCD,789
1,789,100

Table 2 
1,123,XXX
1,456,YYY
1,789,ZZZ
2,123,XXX
2,456,YYY
2,789,ZZZ

Output 
1,XXX,ABCD
1,ABCD,XXX
1,YYY,BCD
1,BCD,ZZZ
1,ZZZ,100


output with a.id=b.id in Join(Please refer below comments for this output)
1       123     XXX     100     100
1       123     123     100     100
1       123     123     100     100
1       ABCD    ABCD    101     101
1       ABCD    ABCD    101     101
1       ABCD    ABCD    101     101
1       456     456     DEF     DEF
1       456     YYY     DEF     DEF
1       456     456     DEF     DEF
1       BCD     BCD     789     789
1       BCD     BCD     789     789
1       BCD     BCD     789     ZZZ
1       789     789     CDE     CDE
1       789     789     CDE     CDE
1       789     ZZZ     CDE     CDE
1       100     100     HBT     HBT
1       100     100     HBT     HBT
1       100     100     HBT     HBT
1       100     100     123     XXX
1       100     100     123     123
1       100     100     123     123

2 个答案:

答案 0 :(得分:0)

我不确定我是否理解你,但这样的事情可以帮助你。

SELECT 
     a.Id
   , CASE WHEN a.Code1 = b.UserCode THEN b.UniversalCode ELSE a.Code1 END AS Code1
   , CASE WHEN a.Code2 = b.UserCode THEN b.UniversalCode ELSE a.Code2 END AS Code2
FROM    table1 a
    LEFT OUTER JOIN 
        table2 b 
        ON a.Id = b.Id;

答案 1 :(得分:0)

我们可以尝试以下查询: -

 SELECT 
    Id,
    CASE WHEN Code1 = UserCode then UniversalCode else Code1 end,
    CASE WHEN Code2= UserCode then UniversalCode else Code2 end
    from
    (select a.id,a.Code1,a.Code2,b.UserCode,b.UniversalCode
    from table1 a
    LEFT OUTER JOIN table2 b ON (a.Id = b.Id and a.code1 = b.UserCode) union 
    select a.id,a.Code1,a.Code2,b.UserCode,b.UniversalCode
    from table1 a
    LEFT OUTER JOIN table2 b ON (a.Id = b.Id and a.code1 = b.UniversalCode)) dat ;