正确的历史数据

时间:2018-01-16 04:02:11

标签: teradata

我有一个场景,我必须更正历史数据。目前的数据如下:

Status_cd   event_id    phase_cd    start_dt    end_dt
110         23456        30         1/1/2017    ?
110         23456        31         1/2/2017    ?


Status_cd   event_id    phase_cd    start_dt    end_dt
110           23456      30          1/1/2017   ?
111           23456      30          1/2/2017   ?

主要列是status_cd和phase_cd。因此,如果其中任何一个更改了历史记录,则应使用下一个记录的开始dt作为上一个记录的结束日期进行处理。

这两个记录都是打开的,这是不正确的。 请建议如何处理这两种情况。

感谢。

1 个答案:

答案 0 :(得分:1)

表格中的历史记录行是如何排序的?换句话说,您如何确定要比较哪些历史记录行以查看值是否已更改?您如何唯一地标识历史行条目?

例如,如果您通过start_dt订购历史记录行,则可以使用窗口函数比较前一行和当前行值,例如Rob建议:

UPDATE MyHistoryTable
FROM (
    -- Get source history rows that need to be updated
    SELECT 
        history_row_id, -- Change this field to match your table
        MAX(status_cd) OVER(ORDER BY start_dt ROWS BETWEEN 1 FOLLOWING AND 1 FOLLOWING) AS status_cd_next, -- Get "status_cd" value for "next" history row
        MAX(phase_cd) OVER(ORDER BY start_dt ROWS BETWEEN 1 FOLLOWING AND 1 FOLLOWING) AS phase_cd_next,
        MAX(start_dt) OVER(ORDER BY start_dt ROWS BETWEEN 1 FOLLOWING AND 1 FOLLOWING) AS start_dt_next
    FROM MyHistoryTable
    WHERE status_cd <> status_cd_next -- Check "status_cd" values are different
    OR phase_cd <> phase_cd_next -- Check "phase_cd" values are different
) src
SET MyHistoryTable.end_dt = src.start_dt_next -- Update "end_dt" value of current history row to be "start_dt" value of next history row
WHERE MyHistoryTable.history_row_id = src.history_row_id -- Match source rows to target rows

这假设您有一列唯一标识每个历史记录行,称为“history_row_id”。试一试,让我知道。

我没有要测试的TD系统,因此您可能需要使用表别名来进行测试。您还可能需要处理边缘情况(即表中的第一行/最后一行)。