SQL Server 2008,我继承了这样一个表(74k行):
create table #mess (keycol char(36) , name1 varchar(254) , name2 varchar(254), valuex varchar(254) )
insert into #mess values ('971EC307-8514-450D-AE3A-4E25EA3F3A10' , 'a' , '' , '' )
insert into #mess values ('971EC307-8514-450D-AE3A-4E25EA3F3A10' , '' , 'a' , 'value-a' )
insert into #mess values ('04FD0C0B-FC90-405A-BFD6-C3AF2516E51F' , 'b' , '' , 'value-b' )
insert into #mess values ('578F2893-15E6-4877-9FE6-AC2F4F351143' , 'c' , '' , 'value-c' )
insert into #mess values ('04FD0C0B-FC90-405A-BFD6-C3AF2516E51F' , '' , 'b' , '' )
insert into #mess values ('FAFCBDFE-D49E-4566-882D-0B6628DA59CC' , '' , 'd' , 'value-d' )
这使得结果集成为:
keycol name1 name2 valuex
------------------------------------ ------- -------- ------------
971EC307-8514-450D-AE3A-4E25EA3F3A10 a
971EC307-8514-450D-AE3A-4E25EA3F3A10 a value-a
04FD0C0B-FC90-405A-BFD6-C3AF2516E51F b value-b
578F2893-15E6-4877-9FE6-AC2F4F351143 c value-c
04FD0C0B-FC90-405A-BFD6-C3AF2516E51F b
FAFCBDFE-D49E-4566-882D-0B6628DA59CC d value-d
我需要这样做(根据keycol
在两行之间匹配时的数据重复数据删除和折叠数据,如果name1
为空则使用name2
,反之亦然但始终使用name1
并始终使用非空valuex
列)。所有的想法都很受欢迎。
感谢。
keycol name1 valuex
------------------------------------ ------- ------------
971EC307-8514-450D-AE3A-4E25EA3F3A10 a value-a
04FD0C0B-FC90-405A-BFD6-C3AF2516E51F b value-b
578F2893-15E6-4877-9FE6-AC2F4F351143 c value-c
FAFCBDFE-D49E-4566-882D-0B6628DA59CC d value-d
答案 0 :(得分:1)
无论如何 - 有两种不同的方式 - 使用DISTINCT,或者GROUP BY来获得你想要的东西:
使用DISTINCT:
SELECT DISTINCT
keycol,
Coalesce(NULLIF(name1,''), name2) as name1,
'Value-' + Coalesce(NULLIF(name1,''), name2) as valuex
FROM
Table
使用GROUP BY:
SELECT
keycol,
Coalesce(max(nullif(name1,'')), max(name2)) as name1,
max(valuex)
FROM
table
Group By
keycol
答案 1 :(得分:0)
您可以使用COALESCE()函数。它接受任意数量的参数,并返回第一个非NULL值作为结果。
编辑: SELECT keycol,COALESCE(name1,name2),valuex GROUP BY keycol
确定。显然是错的..感谢你指出来。我现在就开始醒来......星期一......
答案 2 :(得分:0)
这样的东西?
create table #mess (keycol char(36) , name1 varchar(254) , name2 varchar(254), valuex varchar(254) )
insert into #mess values ('971EC307-8514-450D-AE3A-4E25EA3F3A10' , 'a' , '' , '' )
insert into #mess values ('971EC307-8514-450D-AE3A-4E25EA3F3A10' , '' , 'a' , 'value-a' )
insert into #mess values ('04FD0C0B-FC90-405A-BFD6-C3AF2516E51F' , 'b' , '' , 'value-b' )
insert into #mess values ('578F2893-15E6-4877-9FE6-AC2F4F351143' , 'c' , '' , 'value-c' )
insert into #mess values ('04FD0C0B-FC90-405A-BFD6-C3AF2516E51F' , '' , 'b' , '' )
insert into #mess values ('FAFCBDFE-D49E-4566-882D-0B6628DA59CC' , '' , 'd' , 'value-d' )
select * from #mess
select
n1.keycol, coalesce(n1.name1, n2.name1), n1.valuex
from
(
select keycol, max(nullif(name1, '')) name1, max(nullif(valuex, '')) valuex
from #mess
group by keycol) n1
inner join (
select keycol, max(nullif(name2, '')) name1, max(nullif(valuex, '')) valuex
from #mess
group by keycol) n2
on n1.keycol = n2.keycol
drop table #mess
答案 3 :(得分:0)
看起来数据结构似乎总是只需要每个keycol的非NULL值x行。您应该能够实现这一点,并通过消除带有UNION的NULL valuex行来将name1和name2一起折叠:
SELECT keycol, name1, valuex
FROM tablename
WHERE valuex != '' AND name1 != ''
UNION
SELECT keycol, name2 AS name1, valuex
FROM tablename
WHERE valuex != '' AND name2 != ''
如果每个keycol总是只有一个有效的valuex行,那么这应该有效。如果这不是您的数据布局的情况,请告诉我,我会进一步修改。