使用Hive SQL Query比较当前和下一条记录

时间:2013-06-07 23:44:13

标签: hive

我的RFID标签文件包含大量数据,数据按日期和时间分组。时间值(每个组都有多个标签)。我想知道在第一组和第二组数据之间缺少Tag#。 请帮帮我......

示例文件:

field names: Tag #      Date & Time
1st line -> 00045512|05-01-2013 12:02:03
2nd line -> 00052450|05-01-2013 12:02:03

相同的文件继续不同的时间,但是从时间上排除了2个以上的第1行...(下面)

00052450 | 05-01-2013 13:02:03

基本上我想在我的'Date& amp;时间“领域变化。

这是在SQL中解决的类似问题...(链接附件) http://www.milesdennis.com/2011/06/comparing-current-and-previous-records.html

1 个答案:

答案 0 :(得分:0)

使用左外连接:

select s1.tag, case s2.tag when null then 1 else 0 end  as missing_flag 
from 
    set1 s1
    left outer join set2 s2 on (s1.tag=s2.tag)