如何从SQL Server 2016中的表中删除字符串中的重复项

时间:2017-03-12 14:34:15

标签: sql sql-server sql-server-2016

我有一个包含一列字符串的表。这些字符串由;分隔。现在我想在分割字符串后删除重复项。例如:

-----------
| w;w;e;e |
-----------
| q;r;r;q |
-----------
| b;n;n;b |
-----------

结果应为:

-------
| w;e |
-------
| q;r |
-------
| b;n |
-------

它也不应该是Select函数,而是(不是100%肯定)delete函数。因此,原始表中的值不再重复。

2 个答案:

答案 0 :(得分:2)

对于update语句,这将删除您的列:

update t 
  set col = stuff((
    select distinct
      ';'+s.Value
    from string_split(t.col,';') as s
    for xml path (''), type).value('.','varchar(1024)')
    ,1,1,'');

在sql server 2016中,您可以使用string_split()stuff() with select ... for xml path ('') method of string concatenation来仅连接不同的值。

select 
    t.id
  , t.col
  , dedup = stuff((
    select distinct
      ';'+s.Value
    from string_split(t.col,';') as s
    for xml path (''), type).value('.','varchar(1024)')
    ,1,1,'')
from t

dbfiddle demo:here

rextester演示:http://rextester.com/MAME55141;在没有string_split()的情况下,此演示使用了Jeff Moden的CSV分离器功能。

返回:

+----+---------+-------+
| id |   col   | dedup |
+----+---------+-------+
|  1 | w;w;e;e | e;w   |
|  2 | q;r;r;q | q;r   |
|  3 | b;n;n;b | b;n   |
+----+---------+-------+

拆分字符串参考:

答案 1 :(得分:0)

如果" e"," r"," w"是字符串中唯一的值,那么最简单的方法是重构字符串:

select stuff( (case when string like '%e%' then ';e' else '' end) +
              (case when string like '%r%' then ';r' else '' end) +
              (case when string like '%w%' then ';w' else '' end),
              1, 1, ''
            )

我怀疑这些值可能有限,因为它们看起来像文件权限(读/写/执行)。否则,您需要将字符串解析为单独的行(使用XML,UDF或递归CTE)并重新组合值。

你应该在这里吸取教训。不要将列表存储在字符串中。这些值应该是标志(如果我是正确的,那里只有少数几个值)。或者,它们应该位于另一个表的不同行中。