Question

我有一个包含一列字符串的表。这些字符串由;分隔。现在我想在分割字符串后删除重复项。例如：

-----------
| w;w;e;e |
-----------
| q;r;r;q |
-----------
| b;n;n;b |
-----------

结果应为：

-------
| w;e |
-------
| q;r |
-------
| b;n |
-------

它也不应该是Select函数，而是（不是100％肯定）delete函数。因此，原始表中的值不再重复。

Answer 1

对于update语句，这将删除您的列：

update t 
  set col = stuff((
    select distinct
      ';'+s.Value
    from string_split(t.col,';') as s
    for xml path (''), type).value('.','varchar(1024)')
    ,1,1,'');

在sql server 2016中，您可以使用string_split()和stuff() with select ... for xml path ('') method of string concatenation来仅连接不同的值。

select 
    t.id
  , t.col
  , dedup = stuff((
    select distinct
      ';'+s.Value
    from string_split(t.col,';') as s
    for xml path (''), type).value('.','varchar(1024)')
    ,1,1,'')
from t

dbfiddle demo：here

rextester演示：http://rextester.com/MAME55141;在没有string_split()的情况下，此演示使用了Jeff Moden的CSV分离器功能。

返回：

+----+---------+-------+
| id |   col   | dedup |
+----+---------+-------+
|  1 | w;w;e;e | e;w   |
|  2 | q;r;r;q | q;r   |
|  3 | b;n;n;b | b;n   |
+----+---------+-------+

拆分字符串参考：

Answer 2

如果＆＃34; e＆＃34;，＆＃34; r＆＃34;，＆＃34; w＆＃34;是字符串中唯一的值，那么最简单的方法是重构字符串：

select stuff( (case when string like '%e%' then ';e' else '' end) +
              (case when string like '%r%' then ';r' else '' end) +
              (case when string like '%w%' then ';w' else '' end),
              1, 1, ''
            )

我怀疑这些值可能有限，因为它们看起来像文件权限（读/写/执行）。否则，您需要将字符串解析为单独的行（使用XML，UDF或递归CTE）并重新组合值。

你应该在这里吸取教训。不要将列表存储在字符串中。这些值应该是标志（如果我是正确的，那里只有少数几个值）。或者，它们应该位于另一个表的不同行中。

如何从SQL Server 2016中的表中删除字符串中的重复项

2 个答案: