SQL逗号分隔列=>到行然后总和?

时间:2010-02-26 11:59:52

标签: sql

我正在使用MS SQL 2005 我有一个问题,目前我正在努力寻求解决方案。

我有一个表,其中包含以下列:NameList; Time

Namelist列中包含逗号分隔的数据。表数据如下:

Namelist    Time
John Smith, Jeremy Boyle, Robert Brits, George Aldrich  5
John Smith, Peter Hanson    15
Jeremy Boyle, Robert Brits  10
....

我需要某种SQL表达式来提供这个最终结果:

Name    Total_Time
John Smith  20
Jeremy Boyle    15
Robert Brits    15

等...... 基本上,表达式必须找到行中的所有名称,并使用其他行中的名称对这些名称进行数学运算,并为每个用户添加时间。

我的想法是将逗号分隔的数据转换为行并计算每个的不同记录然后以某种方式知道它的时间是什么...然后乘以.....但我不知道如何实施它

非常感谢任何帮助

谢谢,

4 个答案:

答案 0 :(得分:5)

I prefer the number table approach to split a string in TSQL

要使此方法起作用,您需要执行以下一次性表设置:

SELECT TOP 10000 IDENTITY(int,1,1) AS Number
    INTO Numbers
    FROM sys.objects s1
    CROSS JOIN sys.objects s2
ALTER TABLE Numbers ADD CONSTRAINT PK_Numbers PRIMARY KEY CLUSTERED (Number)

设置Numbers表后,创建此拆分功能:

CREATE FUNCTION [dbo].[FN_ListToTable]
(
     @SplitOn  char(1)      --REQUIRED, the character to split the @List string on
    ,@List     varchar(8000)--REQUIRED, the list to split apart
)
RETURNS TABLE
AS
RETURN 
(

    ----------------
    --SINGLE QUERY-- --this will not return empty rows
    ----------------
    SELECT
        ListValue
        FROM (SELECT
                  LTRIM(RTRIM(SUBSTRING(List2, number+1, CHARINDEX(@SplitOn, List2, number+1)-number - 1))) AS ListValue
                  FROM (
                           SELECT @SplitOn + @List + @SplitOn AS List2
                       ) AS dt
                      INNER JOIN Numbers n ON n.Number < LEN(dt.List2)
                  WHERE SUBSTRING(List2, number, 1) = @SplitOn
             ) dt2
        WHERE ListValue IS NOT NULL AND ListValue!=''

);
GO 

您现在可以轻松地将CSV字符串拆分为表格并加入其中:

select * from dbo.FN_ListToTable(',','1,2,3,,,4,5,6777,,,')

输出:

ListValue
-----------------------
1
2
3
4
5
6777

(6 row(s) affected)

您现在可以使用CROSS APPLY来分割表格中的每一行,如:

DECLARE @YourTable table (NameList varchar(5000), TimeOf int)
INSERT INTO @YourTable VALUES ('John Smith, Jeremy Boyle, Robert Brits, George Aldrich',  5)
INSERT INTO @YourTable VALUES ('John Smith, Peter Hanson',    15)
INSERT INTO @YourTable VALUES ('Jeremy Boyle, Robert Brits',  10)

SELECT
    st.ListValue AS NameOf, SUM(o.TimeOf) AS TimeOf
    FROM @YourTable  o
        CROSS APPLY  dbo.FN_ListToTable(',',o.NameList) AS st
    GROUP BY st.ListValue
    ORDER BY st.ListValue

输出:

NameOf                  TimeOf     
----------------------- -----------
George Aldrich          5          
Jeremy Boyle            15         
John Smith              20         
Peter Hanson            15         
Robert Brits            15         

(5 row(s) affected)

使用它,我建议您更改表设计并使用此输出INSERT到新表。那将是一种更加规范化的方法。另外,不要对列名使用保留字,这样会很麻烦。注意我如何使用“NameOf”和“TimeOf”,所以我避免使用保留字。

答案 1 :(得分:1)

要么:搜索other answers即时,慢慢地重复修复您的数据

或:正常化。为什么你认为正常化存在以及人们为什么会这样做呢?

答案 2 :(得分:1)

您可以创建一个表值函数,将名称列表分成多行:

if object_id('dbo.fnSplitNamelist') is not null
    drop function dbo.fnSplitNamelist
go
create function dbo.fnSplitNamelist(
    @namelist varchar(max))
returns @names table (
    name varchar(50))
as 
    begin
    declare @start int
    declare @end int
    set @start = 0
    while IsNull(@end,0) <> len(@namelist) + 1
        begin
        set @end = charindex(',', @namelist, @start)
        if @end = 0
            set @end = len(@namelist) + 1

        insert into @names select ltrim(rtrim(
            substring(@namelist,@start,@end-@start)))

        set @start = @end + 1
        end
    return
    end
go

您可以使用cross apply返回每个名单的名称。然后,您可以使用group by来计算每个用户的时间:

declare @YourTable table (namelist varchar(1000), time int)

insert into @YourTable
select 'John Smith, Jeremy Boyle, Robert Brits, George Aldrich',  5
union all select 'John Smith, Peter Hanson',  15
union all select 'Jeremy Boyle, Robert Brits',  10

select fn.name, sum(t.time)
from @YourTable t
cross apply fnSplitNamelist(t.namelist) fn
group by fn.name

这导致:

George Aldrich      5
Jeremy Boyle        15
John Smith          20
Peter Hanson        15
Robert Brits        15

答案 3 :(得分:0)

最佳选择是规范化数据。然后,这将更容易使用。

第二个最佳选择是使用递归查询从每个名称列表中一次选择一个名称,并作为单独名称的列表及其每个记录的相应时间返回,然后使用分组对每个名称的时间求和名。

无需用户定义的函数或预先创建的表。 ;)

with NameTime ([Name], [Time], Namelist)
as (
  select cast(null as varchar(100)), [Time], Namelist
  from NamelistTime
  union all
  select
    case when Pos = 0 then NameList else substring(Namelist, 1, Pos - 1) end,
    [Time],
    case when Pos = 0 then null else substring(NameList, Pos + 2, len(Namelist) - Pos - 1) end
  from (
    select [Time], Namelist, Pos = charindex(', ', Namelist)
    from NameTime
  ) x
  where Namelist is not null
)
select [Name], sum([Time])
from NameTime
where [Name] is not null
group by [Name]

相比之下,使用标准化数据,就像:

一样简单
select p.Name, sum(n.Time)
from NamelistTime n
inner join Person p on p.PersonId = n.PersonId
group by p.Name