如何加入到列中具有多个值的表?

时间:2010-11-04 15:23:06

标签: sql-server sql-server-2005 tsql

我有一个包含错误代码字段的人员表,该字段可能包含多个错误代码(001,002,003 ...)。我知道这是一个架构问题,但这是一个供应商应用程序,我无法控制架构,所以我必须使用我所拥有的。

还有一个包含ErrorCode(char(3))和Descript(char(1000))的Error表。在我的查询中,Person.ErrorCode连接到Error.ErrorCode以获取相应描述的值。

对于只有一个错误代码的人员记录,我可以毫无问题地获得相应的描述。我想要做的是以某种方式将Descript值连接到存在多个错误的记录。

例如,这是来自错误表的一些示例数据:

ErrorCode     Descript
001           Problem with person file
002           Problem with address file
003           Problem with grade

以下是我的SELECT on Person上的一个列,其中包含一个错误的JOIN:

Person.RecID   Person.ErrorCode  Error.Descript
12345          001               Problem with person file
12346          003               Problem with grade
12347          002,003

我想要得到的是:

Person.RecID   Person.ErrorCode  Error.Descript
12345          001               Problem with person file
12346          003               Problem with grade
12347          002,003           Problem with address file, Problem with grade

建议赞赏!

5 个答案:

答案 0 :(得分:5)

您应该看到:"Arrays and Lists in SQL Server 2005 and Beyond, When Table Value Parameters Do Not Cut it" by Erland Sommarskog,然后有很多方法可以在SQL Server中拆分字符串。本文涵盖几乎所有方法的PRO和CON。通常,您需要创建拆分功能。这是分割函数可用于连接行的方式:

SELECT
    * 
    FROM dbo.yourSplitFunction(@Parameter) b
        INNER JOIN YourCodesTable          c ON b.ListValue=c.CodeValue

I prefer the number table approach to split a string in TSQL但是有很多方法可以在SQL Server中拆分字符串,请参阅上一个链接,该链接解释了每个链接的PRO和CON。

要使Numbers Table方法起作用,您需要进行一次性表设置,这将创建一个包含1到10,000行的表Numbers

SELECT TOP 10000 IDENTITY(int,1,1) AS Number
    INTO Numbers
    FROM sys.objects s1
    CROSS JOIN sys.objects s2
ALTER TABLE Numbers ADD CONSTRAINT PK_Numbers PRIMARY KEY CLUSTERED (Number)

设置Numbers表后,创建此拆分功能:

CREATE FUNCTION [dbo].[FN_ListToTable]
(
     @SplitOn  char(1)      --REQUIRED, the character to split the @List string on
    ,@List     varchar(8000)--REQUIRED, the list to split apart
)
RETURNS TABLE
AS
RETURN 
(

    ----------------
    --SINGLE QUERY-- --this will not return empty rows
    ----------------
    SELECT
        ListValue
        FROM (SELECT
                  LTRIM(RTRIM(SUBSTRING(List2, number+1, CHARINDEX(@SplitOn, List2, number+1)-number - 1))) AS ListValue
                  FROM (
                           SELECT @SplitOn + @List + @SplitOn AS List2
                       ) AS dt
                      INNER JOIN Numbers n ON n.Number < LEN(dt.List2)
                  WHERE SUBSTRING(List2, number, 1) = @SplitOn
             ) dt2
        WHERE ListValue IS NOT NULL AND ListValue!=''

);
GO 

您现在可以轻松地将CSV字符串拆分为表格并加入其中:

DECLARE @ErrorCode table (ErrorCode varchar(20), Description varchar(30))
INSERT @ErrorCode VALUES ('001','Problem with person file')
INSERT @ErrorCode VALUES ('002','Problem with address file')
INSERT @ErrorCode VALUES ('003','Problem with grade')

DECLARE @Person table (RecID int, ErrorCode varchar(20))
INSERT @Person VALUES (12345 ,'001'    )
INSERT @Person VALUES (12346 ,'003'    )
INSERT @Person VALUES (12347 ,'002,003')


SELECT
    p.RecID,c.ListValue,e.Description
    FROM @Person                                        p
        CROSS APPLY dbo.FN_ListToTable(',',p.ErrorCode) c
        INNER JOIN @ErrorCode                           e ON c.ListValue=e.ErrorCode

输出:

RecID       ListValue     Description              
----------- ------------- -------------------------
12345       001           Problem with person file 
12346       003           Problem with grade       
12347       002           Problem with address file
12347       003           Problem with grade       

(4 row(s) affected)

您可以使用XML技巧将行重新连接在一起:

SELECT
    t1.RecID,t1.ErrorCode
        ,STUFF(
                   (SELECT
                        ', ' + e.Description
                        FROM @Person                                        p
                            CROSS APPLY dbo.FN_ListToTable(',',p.ErrorCode) c
                            INNER JOIN @ErrorCode                           e ON c.ListValue=e.ErrorCode
                        WHERE t1.RecID=p.RecID
                        ORDER BY p.ErrorCode
                        FOR XML PATH(''), TYPE
                   ).value('.','varchar(max)')
                   ,1,2, ''
              ) AS ChildValues
    FROM @Person t1
    GROUP BY t1.RecID,t1.ErrorCode

输出:

RecID       ErrorCode            ChildValues
----------- -------------------- -----------------------------------------------
12345       001                  Problem with person file
12346       003                  Problem with grade
12347       002,003              Problem with address file, Problem with grade

(3 row(s) affected)

返回与上面相同的结果集,但可能表现更好:

SELECT
    t1.RecID,t1.ErrorCode
        ,STUFF(
                   (SELECT
                        ', ' + e.Description
                        FROM (SELECT ListValue FROM dbo.FN_ListToTable(',',t1.ErrorCode)) c
                            INNER JOIN @ErrorCode e ON c.ListValue=e.ErrorCode
                        ORDER BY c.ListValue
                        FOR XML PATH(''), TYPE
                   ).value('.','varchar(max)')
                   ,1,2, ''
              ) AS ChildValues
    FROM @Person t1
    GROUP BY t1.RecID,t1.ErrorCode

答案 1 :(得分:1)

在使用error.errorcode

连接之前对person.errorcode进行反规范化

我不是指表级别的非规范化,我的意思是使用视图或SQL代码。

答案 2 :(得分:0)

您可以使用公用表表达式来假装人员表是正常的:

;WITH PersonPrime as (
    SELECT RecID,ErrorCode,CAST(null as varchar(100)) as Remain from Person where Value not like '%,%'
    UNION ALL
    SELECT RecID,SUBSTRING(ErrorCode,1,CHARINDEX(',',ErrorCode)-1),SUBSTRING(ErrorCode,CHARINDEX(',',ErrorCode)+1,100) from Person where Value like '%,%'
    UNION ALL
    SELECT RecID,Remain,null FROM PersonPrime where Remain not like '%,%'
    UNION ALL
    SELECT RecID,SUBSTRING(Remain,1,CHARINDEX(',',Remain)-1),SUBSTRING(Remain,CHARINDEX(',',Remain)+1,100) from PersonPrime where Remain like '%,%'
)
SELECT RecID,ErrorCode from PersonPrime

现在使用PersonPrime,您在原始查询中使用了Person。你想要将varchar列中的null作为与Person表中的ErrorCode一样宽的

答案 3 :(得分:0)

连接错误描述可能不是可行的方法。它为SQL语句增加了不必要的复杂性,这对于调试来说是非常有问题的。 SQL的任何未来添加或更改也将是困难的。您最好的选择是生成一个规范化的结果集,即使您的模式不是。

SELECT Person.RecID, Person.ErrorCode, Error.ErrorCode, Error.Descript
  FROM Person INNER JOIN Error
    ON REPLACE(Person.ErrorCode, ' ', '') LIKE '%,' + CONVERT(VARCHAR,Error.ErrorCode) + ',%'

如果某人设置了多个错误代码,则会为指定的每个错误返回一行(忽略重复项)。使用您的示例,它将返回此。

Person.RecID   Person.ErrorCode   Error.ErrorCode   Error.Descript
12345          001                001               Problem with person file
12346          003                003               Problem with grade
12347          002,003            002               Problem with address file
12347          002,003            003               Problem with grade

答案 4 :(得分:-2)

通过将错误分组并将它们连接起来是一个选项:

SELECT *, GROUP_CONCAT(Person.ErrorCode) FROM Person
GROUP BY Person.RecID