Sql将分隔的字符串与已知的值表进行比较以查找不匹配

时间:2017-02-06 15:49:45

标签: sql sql-server tsql stored-procedures

我正在尝试编写一个存储过程来检查字符串是否包含另一个表中的值。

我无法控制TableA,存储在此理论Packages列中的数据是一组分隔的单词。

为了演示,TableA包含一个列,包。此列包含以插入符号分隔的包字符串,E.G A^B表示此行包含2个包。

TableB是我控制的表,列出了可用的包。

正如我们所看到的,TableA有一些行没有相应的包;例如D

表A

ID  |  Packages
============
1   |  A
2   |  A^B
3   |  C
4   |  A^B
5   |  A^C
6   |  D
7   |  C^D

表B

ID  |  Package
============
91  |  A
92  |  B
93  |  C

我正在尝试编写一个脚本,将TableA中的包与TableB中已知的Package列表进行比较,并选择TableA中没有支持包的任何行。

一旦运行,我的目标是返回类似于此的结果,

TableAID  |  PackageNotSupported
================================
6         |  D
7         |  D

我无法真正展示到目前为止我所尝试的内容,因为我不知道从哪里开始。我在数据库中有一个函数,它将分隔的字符串拆分为一个表。我可以对xx^xx^xx数据使用它,但我根本无法弄清楚如何加入/比较字符串。

我尝试了在这篇文章How to compare multiple values in one column against a delimited string in a stored procedure中找到的解决方案,但无法得到我的目标。最终,SQL不是我的强项,我对该帖子中提出的解决方案没有最大的理解。

1 个答案:

答案 0 :(得分:3)

选项1 - 没有解析/拆分功能

Declare @TableA table (ID int,Packages varchar(25))
Insert Into @TableA values
(1   ,'A'),
(2   ,'A^B'),
(3   ,'C'),
(4   ,'A^B'),
(5   ,'A^C'),
(6   ,'D'),
(7   ,'C^D')

Declare @TableB table (ID int,Package varchar(25))
Insert Into @TableB values
(1   ,'A'),
(2   ,'B'),
(3   ,'C')


Select A.ID
      ,Package=B.RetVal 
 From  @TableA A
 Cross Apply (
                Select RetSeq = Row_Number() over (Order By (Select null))
                      ,RetVal = LTrim(RTrim(B.i.value('(./text())[1]', 'varchar(max)')))
                From  (Select x = Cast('<x>' + replace((Select replace(A.Packages,'^','§§Split§§') as [*] For XML Path('')),'§§Split§§','</x><x>')+'</x>' as xml).query('.')) as A 
                Cross Apply x.nodes('x') AS B(i)
             ) B
 Left Join @TableB C on B.RetVal=C.Package
 Where  C.Package is null

<强>返回

ID  Package
6   D
7   D

选项2 - 使用解析/拆分功能

Select A.ID
      ,Package=B.RetVal 
 From  @TableA A
 Cross Apply  [dbo].[udf-Str-Parse](A.Packages,'^') B
 Left Join @TableB C on B.RetVal=C.Package
 Where  C.Package is null

如果感兴趣的话,解析UDF

CREATE FUNCTION [dbo].[udf-Str-Parse] (@String varchar(max),@Delimiter varchar(25))
Returns Table 
As
Return (  
    with   cte1(N)   As (Select 1 From (Values(1),(1),(1),(1),(1),(1),(1),(1),(1),(1)) N(N)),
           cte2(N)   As (Select Top (IsNull(DataLength(@String),0)) Row_Number() over (Order By (Select NULL)) From (Select N=1 From cte1 a,cte1 b,cte1 c,cte1 d) A ),
           cte3(N)   As (Select 1 Union All Select t.N+DataLength(@Delimiter) From cte2 t Where Substring(@String,t.N,DataLength(@Delimiter)) = @Delimiter),
           cte4(N,L) As (Select S.N,IsNull(NullIf(CharIndex(@Delimiter,@String,s.N),0)-S.N,8000) From cte3 S)

    Select RetSeq = Row_Number() over (Order By A.N)
          ,RetVal = LTrim(RTrim(Substring(@String, A.N, A.L)))
    From   cte4 A
);
--Orginal Source http://www.sqlservercentral.com/articles/Tally+Table/72993/
--Much faster than str-Parse, but limited to 8K
--Select * from [dbo].[udf-Str-Parse-8K]('Dog,Cat,House,Car',',')
--Select * from [dbo].[udf-Str-Parse-8K]('John||Cappelletti||was||here','||')