row_number()over()连续超过联合选择

时间:2019-04-16 06:45:50

标签: sql hive union hiveql row-number

我正在创建一个表,并使用query1联合query2将数据插入到该表中。问题是我想将row_number()添加到表中,但是当我将row_number()over()添加到两个查询中时,编号仅适用于query1或query2,而不适用于整个表。

我进行了破解以获取结果,方法是使用插入查询1联合查询2将数据插入表(table_no_serial),然后像这样创建第二个表

insert into table_w_serial select row_number() over(), * from table_no_serial;

是否有可能在第一时间解决这个问题?

insert into table purchase_table 
select row_number() over(), w.ts, w.tail, w.event, w.action, w.msg, w.tags 
from table1 w 
where 
w.action = 'stop'
union 
select row_number() over(), t.ts, t.tail, t.event, t.action, t.msg, t.tags 
from table2 t
where 
f.action = 'stop';

我想要类似的东西。

我想编写一个代码,其中结果表(endtable)将是第一个查询和第二个查询的并集,并且在两个查询中都包含一个恒定的行号,以便如果query1返回50个结果,而query2返回40个结果。终端表的行号为1-90

1 个答案:

答案 0 :(得分:1)

使用子查询:

insert into table purchase_table ( . . . ) -- include column names here
    select row_number() over (), ts, tail, event, action, msg, tags
    from ((select w.ts, w.tail, w.event, w.action, w.msg, w.tags 
           from table1 w 
           where w.action = 'stop'
          ) union all 
          (select w.ts, w.tail, w.event, w.action, w.msg, w.tags 
           from table2 w
           where f.action = 'stop'
          )
         ) w;

请注意,这也会将union更改为union allunion all效率更高;仅在您要承担删除重复项的开销时才使用union