检测历史记录表中某个列的更改

时间:2017-08-15 06:37:25

标签: sql postgresql postgresql-9.4

考虑以下数据:

history.data
=======================================
id |data_id| col1  | col2  | date
---+-------+-------+-------+-----------
1  |1      | 123   | 321   | 2017-08-01
2  |1      | 124   | 321   | 2017-08-03
3  |2      | 222   | 555   | 2017-08-05
4  |2      | 242   | 555   | 2017-08-07
5  |2      | 242   | 333   | 2017-08-11

所以这是history_data表,我将所有更改保存在某个表中。 现在,我需要获取data列中col1的每个条目的最后一次更改的日期。 在这种情况下,所需的输出应为

data_id | date
--------+-----------
1       | 2017-08-03
2       | 2017-08-07

我需要在以下环境中执行此操作:

with cte1 as (
    select distinct on(data_id)
    data_id,
    date::date

    from data d
    join history.data hd on hd.data_id = d.id
    order by d.id, hd.date desc
)

正如您所看到的,目前我只是获取最后一次记录更改的日期,而不管发生了哪些更改列。

有人可以帮助我吗?

3 个答案:

答案 0 :(得分:2)

您可以使用lag()获取之前的prev_col1值,使用prev_col1 <> col1来识别发生更改的所有行:

select distinct on(data_id) * from (
    select lag(col1) over (partition by data_id order by d.id) prev_col1,
    d.id,
    col1,
    data_id,
    date::date
    from data d
    join history.data hd on hd.data_id = d.id
) t where prev_col1 <> col1 or prev_col1 is null
order by id desc

每个prev_col1 is null只有1个成员的群组需要data_id条件,并假设第一个成员有资格作为更改。

答案 1 :(得分:1)

select data_id, max(mindt) from (
    select data_id, col1, min(date) as mindt
    from history_data
    group by data_id, col1
) t
group by data_id

答案 2 :(得分:1)

您可以使用以下查询:

select distinct on(data_id)
       data_id,
       col1
from data d
join history_data hd on d.id = hd.data_id
order by data_id, date desc;

col1获取最后 data_id值:

data_id col1
-------------
1   124
2   242

使用上述查询作为派生表,您可以加入到原始表中,以获取每个组的最早日期:

select t1.data_id, t1.col1, min(date::date)
from history_data t1
join (
   select distinct on(data_id)
          data_id,
          col1
   from data d
   join history_data hd on d.id = hd.data_id
   order by data_id, date desc
) t2 on t1.data_id = t2.data_id and t1.col1 = t2.col1
group by t1.data_id, t1.col1;

<强>输出:

data_id col1    min
---------------------------
1       124     03.08.2017 
2       242     07.08.2017 

注意:该查询还会返回与只有一个 data_id值相关的col1个组。您需要稍微更改查询以过滤掉这些行,以防您不需要它们。

Demo here