如何获得在分区更改时重新启动的RANK? 我有这张桌子:
ID Date Value
1 2015-01-01 1
2 2015-01-02 1 <redundant
3 2015-01-03 2
4 2015-01-05 2 <redundant
5 2015-01-06 1
6 2015-01-08 1 <redundant
7 2015-01-09 1 <redundant
8 2015-01-10 2
9 2015-01-11 3
10 2015-01-12 3 <redundant
我尝试删除上一个条目中未更改值的所有行(标有&lt; redundant )。 我尝试使用游标,但需要太长时间,因为该表有大约5000万行。
我也尝试过使用RANK:
SELECT ID, Date, Value,
RANK() over(partition by Value order by Date ASC) Rank,
FROM DataLogging
ORDER BY Date ASC
但我明白了:
ID Date Value Rank (Rank)
1 2015-01-01 1 1 (1)
2 2015-01-02 1 2 (2)
3 2015-01-03 2 1 (1)
4 2015-01-05 2 2 (2)
5 2015-01-06 1 3 (1)
6 2015-01-08 1 4 (2)
7 2015-01-09 1 5 (3)
8 2015-01-10 2 3 (1)
9 2015-01-11 3 1 (1)
10 2015-01-12 3 2 (2)
parantheses中的是我想要的等级,因此我可以过滤掉Rank = 1的行并删除其余的行。
编辑:我已经接受了似乎最容易编写的答案,但不幸的是,没有一个答案能够快速删除行。 最后,我决定使用 CURSOR 毕竟。我在大约250k行的块中拆分数据,光标穿过并删除每批250k行约11分钟的行,下面的答案,DELETE,每批250k行需要约35分钟答案 0 :(得分:5)
这是一种有点复杂的方法:
${mapName["option1"]}
结果是:
WITH CTE AS
(
SELECT *,
ROW_NUMBER() OVER(ORDER BY [Date]) RN1,
ROW_NUMBER() OVER(PARTITION BY Value ORDER BY [Date]) RN2
FROM dbo.YourTable
), CTE2 AS
(
SELECT *, ROW_NUMBER() OVER(PARTITION BY Value, RN1 - RN2 ORDER BY [Date]) N
FROM CTE
)
SELECT *
FROM CTE2
ORDER BY ID;
要删除您不想要的行,您只需执行以下操作:
╔════╦════════════╦═══════╦═════╦═════╦═══╗
║ ID ║ Date ║ Value ║ RN1 ║ RN2 ║ N ║
╠════╬════════════╬═══════╬═════╬═════╬═══╣
║ 1 ║ 2015-01-01 ║ 1 ║ 1 ║ 1 ║ 1 ║
║ 2 ║ 2015-01-02 ║ 1 ║ 2 ║ 2 ║ 2 ║
║ 3 ║ 2015-01-03 ║ 2 ║ 3 ║ 1 ║ 1 ║
║ 4 ║ 2015-01-05 ║ 2 ║ 4 ║ 2 ║ 2 ║
║ 5 ║ 2015-01-06 ║ 1 ║ 5 ║ 3 ║ 1 ║
║ 6 ║ 2015-01-08 ║ 1 ║ 6 ║ 4 ║ 2 ║
║ 7 ║ 2015-01-09 ║ 1 ║ 7 ║ 5 ║ 3 ║
║ 8 ║ 2015-01-10 ║ 2 ║ 8 ║ 3 ║ 1 ║
║ 9 ║ 2015-01-11 ║ 3 ║ 9 ║ 1 ║ 1 ║
║ 10 ║ 2015-01-12 ║ 3 ║ 10 ║ 2 ║ 2 ║
╚════╩════════════╩═══════╩═════╩═════╩═══╝
答案 1 :(得分:2)
如果您想删除行,我建议您使用lag()
:
with todelete as (
select t.*, lag(value) over (order by date) as prev_value
from t
)
delete from todelete
where value = prev_value;
我不太确定rank()
与问题的关系。
编辑:
要查看使用相同逻辑删除的行 :
with todelete as (
select t.*, lag(value) over (order by date) as prev_value
from t
)
select *
from todelete
where value <> prev_value or prev_value is null;
where
子句只是第一个查询中where
子句的反转,考虑了NULL
值。
答案 2 :(得分:1)
select *
from ( select ID, Date, Value, lag(Value, 1, 0) over (order by ID) as ValueLag
from table ) tt
where ValueLag is null or ValueLag <> Value
如果订单是日期然后结束(按日期排序)
这应该告诉你好坏 - 它是基于ID - 你需要约会然后修改
它可能看起来很长,但它应该非常有效
declare @tt table (id tinyint, val tinyint);
insert into @tt values
( 1, 1),
( 2, 1),
( 3, 2),
( 4, 2),
( 5, 1),
( 6, 1),
( 7, 1),
( 8, 2),
( 9, 3),
(10, 3);
select id, val, LAG(val) over (order by id) as lagVal
from @tt;
-- find the good
select id, val
from ( select id, val, LAG(val) over (order by id) as lagVal
from @tt
) tt
where lagVal is null or lagVal <> val
-- select the bad
select tt.id, tt.val
from @tt tt
left join ( select id, val
from ( select id, val, LAG(val) over (order by id) as lagVal
from @tt
) ttt
where ttt.lagVal is null or ttt.lagVal <> ttt.val
) tttt
on tttt.id = tt.id
where tttt.id is null
答案 3 :(得分:0)
这很有趣,所以我想我会跳进来。不幸的是,在没有先转换数据的情况下创建一个RANK()
(或更确切地说,ROW_NUMBER()
)的解决方案看起来像是无法获得。为了转换数据,我提出了使用1 ROW_NUMBER()
:
;WITH Ordered AS
(
SELECT ROW_NUMBER() OVER (ORDER BY [Date]) AS [Row], *
FROM DataLogging
),
Final AS
(
SELECT
o1.*, NULLIF(o1.Value - ISNULL(o2.Value, o1.Value - 1), 0) [Change]
FROM
Ordered o1
LEFT JOIN Ordered o2 ON
o1.[Row] = o2.[Row] + 1
)
SELECT * FROM Final
在上一个Change
列中,如果值没有变化,则值为NULL
(但如果有变化则会有差异)。
要执行删除操作,请将选择更改为
DELETE FROM DataLogging where Change IS NULL
编辑:Lag也可以在这里工作,但我一直在想象解决方案,因为我一直在完全忘记了这一点。
答案 4 :(得分:0)
为我的案子工作!谢谢 我必须获取report_to才能将雇员更改为以前的report_to值和effdt。 换句话说,每个报表的最低生效日期行要更改为员工。
,以选中( 选择T.emplid,T.reports_to,T.effdt,(按effdt排序)的滞后(reports_to)作为prev_value 从PS_JOB t ) 选择 * 从检查 其中report_to <> prev_value或prev_value为空;
添加了进一步的变化p