在Microsoft SQL Server 2005中模拟group_concat MySQL函数?

时间:2009-01-16 18:14:53

标签: sql sql-server sql-server-2005 string-aggregation

我正在尝试将基于MySQL的应用程序迁移到Microsoft SQL Server 2005(不是选择,但这就是生活)。

在原始应用中,我们使用几乎完全符合ANSI-SQL的语句,但有一个重要的例外 - 我们经常使用MySQL的group_concat函数。

顺便提一下,

group_concat这样做:给出一张员工姓名和项目表......

SELECT empName, projID FROM project_members;

返回:

ANDY   |  A100
ANDY   |  B391
ANDY   |  X010
TOM    |  A100
TOM    |  A510

...以下是group_concat的内容:

SELECT 
    empName, group_concat(projID SEPARATOR ' / ') 
FROM 
    project_members 
GROUP BY 
    empName;

返回:

ANDY   |  A100 / B391 / X010
TOM    |  A100 / A510

所以我想知道的是:是否可以在SQL Server中编写用户定义的函数来模拟group_concat的功能?

我几乎没有使用UDF,存储过程或类似的东西的经验,只是直接的SQL,所以请错误地解释:)

12 个答案:

答案 0 :(得分:165)

没有真正简单的方法来做到这一点。不过有很多想法。

Best one I've found

SELECT table_name, LEFT(column_names , LEN(column_names )-1) AS column_names
FROM information_schema.columns AS extern
CROSS APPLY
(
    SELECT column_name + ','
    FROM information_schema.columns AS intern
    WHERE extern.table_name = intern.table_name
    FOR XML PATH('')
) pre_trimmed (column_names)
GROUP BY table_name, column_names;

如果数据可能包含<

等字符,则该版本可正常运行
WITH extern
     AS (SELECT DISTINCT table_name
         FROM   INFORMATION_SCHEMA.COLUMNS)
SELECT table_name,
       LEFT(y.column_names, LEN(y.column_names) - 1) AS column_names
FROM   extern
       CROSS APPLY (SELECT column_name + ','
                    FROM   INFORMATION_SCHEMA.COLUMNS AS intern
                    WHERE  extern.table_name = intern.table_name
                    FOR XML PATH(''), TYPE) x (column_names)
       CROSS APPLY (SELECT x.column_names.value('.', 'NVARCHAR(MAX)')) y(column_names) 

答案 1 :(得分:164)

我可能有点迟到了,但这种方法适合我,比COALESCE方法更容易。

SELECT STUFF(
             (SELECT ',' + Column_Name 
              FROM Table_Name
              FOR XML PATH (''))
             , 1, 1, '')

答案 2 :(得分:47)

现在可能太晚了,但这不是最容易做事的方法吗?

SELECT     empName, projIDs = replace
                          ((SELECT Surname AS [data()]
                              FROM project_members
                              WHERE  empName = a.empName
                              ORDER BY empName FOR xml path('')), ' ', REQUIRED SEPERATOR)
FROM         project_members a
WHERE     empName IS NOT NULL
GROUP BY empName

答案 3 :(得分:38)

SQL Server 2017 确实引入了新的聚合函数

STRING_AGG ( expression, separator)

  

连接字符串表达式的值并放置分隔符   它们之间的价值。字符串末尾没有添加分隔符。

可以通过附加WITHIN GROUP (ORDER BY some_expression)

来排序连接元素

对于2005-2016版本,我通常在接受的答案中使用XML方法。

然而,在某些情况下,这可能会失败。例如如果要连接的数据包含CHAR(29),您会看到

  

FOR XML无法序列化数据......因为它   包含XML中不允许的字符(0x001D)。

可以处理所有字符的更健壮的方法是使用CLR聚合。然而,使用这种方法对连接元素应用排序更加困难。

分配给变量的方法是not guaranteed,应该在生产代码中避免使用。

答案 4 :(得分:33)

看看Github上的GROUP_CONCAT项目,我想我的确是你正在寻找的:

  

该项目包含一组SQLCLR用户定义聚合函数(SQLCLR UDA),它们共同提供与MySQL GROUP_CONCAT函数类似的功能。根据所需功能,有多种功能可确保最佳性能......

答案 5 :(得分:10)

连接具有多个项目经理的项目中的所有项目经理名称:

SELECT a.project_id,a.project_name,Stuff((SELECT N'/ ' + first_name + ', '+last_name FROM projects_v 
where a.project_id=project_id
 FOR
 XML PATH(''),TYPE).value('text()[1]','nvarchar(max)'),1,2,N''
) mgr_names
from projects_v a
group by a.project_id,a.project_name

答案 6 :(得分:9)

使用以下代码,您必须在部署之前在项目属性上设置PermissionLevel = External,并将数据库更改为信任外部代码(请务必通过运行“ALTER”在其他地方阅读有关安全风险和替代方案[如证书]) DATABASE database_name SET TRUSTWORTHY ON“。

using System;
using System.Collections.Generic;
using System.Data.SqlTypes;
using System.IO;
using System.Runtime.Serialization;
using System.Runtime.Serialization.Formatters.Binary;
using Microsoft.SqlServer.Server;

[Serializable]
[SqlUserDefinedAggregate(Format.UserDefined,
MaxByteSize=8000,
IsInvariantToDuplicates=true,
IsInvariantToNulls=true,
IsInvariantToOrder=true,
IsNullIfEmpty=true)]
    public struct CommaDelimit : IBinarySerialize
{


[Serializable]
 private class StringList : List<string>
 { }

 private StringList List;

 public void Init()
 {
  this.List = new StringList();
 }

 public void Accumulate(SqlString value)
 {
  if (!value.IsNull)
   this.Add(value.Value);
 }

 private void Add(string value)
 {
  if (!this.List.Contains(value))
   this.List.Add(value);
 }

 public void Merge(CommaDelimit group)
 {
  foreach (string s in group.List)
  {
   this.Add(s);
  }
 }

 void IBinarySerialize.Read(BinaryReader reader)
 {
    IFormatter formatter = new BinaryFormatter();
    this.List = (StringList)formatter.Deserialize(reader.BaseStream);
 }

 public SqlString Terminate()
 {
  if (this.List.Count == 0)
   return SqlString.Null;

  const string Separator = ", ";

  this.List.Sort();

  return new SqlString(String.Join(Separator, this.List.ToArray()));
 }

 void IBinarySerialize.Write(BinaryWriter writer)
 {
  IFormatter formatter = new BinaryFormatter();
  formatter.Serialize(writer.BaseStream, this.List);
 }
    }

我使用类似以下的查询对此进行了测试:

SELECT 
 dbo.CommaDelimit(X.value) [delimited] 
FROM 
 (
  SELECT 'D' [value] 
  UNION ALL SELECT 'B' [value] 
  UNION ALL SELECT 'B' [value] -- intentional duplicate
  UNION ALL SELECT 'A' [value] 
  UNION ALL SELECT 'C' [value] 
 ) X 

产量:A,B,C,D

答案 7 :(得分:9)

试过这些但是出于我在MS SQL Server 2005中的目的,以下是最有用的,我在xaprb找到了

declare @result varchar(8000);

set @result = '';

select @result = @result + name + ' '

from master.dbo.systypes;

select rtrim(@result);

@Mark正如你所提到的那样,空间角色给我带来了问题。

答案 8 :(得分:6)

关于J Hardiman的回答,怎么样:

SELECT empName, projIDs=
  REPLACE(
    REPLACE(
      (SELECT REPLACE(projID, ' ', '-somebody-puts-microsoft-out-of-his-misery-please-') AS [data()] FROM project_members WHERE empName=a.empName FOR XML PATH('')), 
      ' ', 
      ' / '), 
    '-somebody-puts-microsoft-out-of-his-misery-please-',
    ' ') 
  FROM project_members a WHERE empName IS NOT NULL GROUP BY empName

顺便说一下,使用“Surname”是一个错字还是我不理解这里的概念?

无论如何,非常感谢大家,因为它节省了我一段时间:)。

答案 9 :(得分:0)

对于我的Google同事来说,这是一个非常简单的即插即用解决方案,在与较复杂的解决方案斗争了一段时间之后,它对我有用:

SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ CONVERT(VARCHAR(10), projID ) 
                     FROM returns 
                     WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM 
returns t

请注意,我必须将ID转换为VARCHAR才能将其连接为字符串。如果您不必这样做,这是一个更简单的版本:

SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ projID
                     FROM returns 
                     WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM 
returns t

所有功劳归于此处: https://social.msdn.microsoft.com/Forums/sqlserver/en-US/9508abc2-46e7-4186-b57f-7f368374e084/replicating-groupconcat-function-of-mysql-in-sql-server?forum=transactsql

答案 10 :(得分:0)

UPDATE 2020: SQL Server 2016 + JSON 序列化和反序列化示例

由OP提供的数据插入到名为#project_members的临时表中

drop table if exists #project_members;
create table #project_members(
  empName        varchar(20) not null,
  projID         varchar(20) not null);
go
insert #project_members(empName, projID) values
('ANDY', 'A100'),
('ANDY', 'B391'),
('ANDY', 'X010'),
('TOM', 'A100'),
('TOM', 'A510');

如何使用包含projID的嵌套数组将这些数据序列化为单个JSON字符串

select empName, (select pm_json.projID 
                 from #project_members pm_json 
                 where pm.empName=pm_json.empName 
                 for json path, root('projList')) projJSON
from #project_members pm
group by empName
for json path;

结果

'[
  {
    "empName": "ANDY",
    "projJSON": {
      "projList": [
        { "projID": "A100" },
        { "projID": "B391" },
        { "projID": "X010" }
      ]
    }
  },
  {
    "empName": "TOM",
    "projJSON": {
      "projList": [
        { "projID": "A100" },
        { "projID": "A510" }
      ]
    }
  }
]'

如何将这些数据从单个JSON字符串反序列化回其原始行和列

declare @json           nvarchar(max)=N'[{"empName":"ANDY","projJSON":{"projList":[{"projID":"A100"},
                                         {"projID":"B391"},{"projID":"X010"}]}},{"empName":"TOM","projJSON":
                                         {"projList":[{"projID":"A100"},{"projID":"A510"}]}}]';

select oj.empName, noj.projID 
from openjson(@json) with (empName        varchar(20),
                           projJSON       nvarchar(max) as json) oj
     cross apply openjson(oj.projJSON, '$.projList') with (projID    varchar(20)) noj;

结果

empName projID
ANDY    A100
ANDY    B391
ANDY    X010
TOM     A100
TOM     A510

如何将唯一的empName持久化到表并将projID存储在嵌套的JSON数组中

drop table if exists #project_members_with_json;
create table #project_members_with_json(
  empName        varchar(20) unique not null,
  projJSON       nvarchar(max) not null);
go
insert #project_members_with_json(empName, projJSON) 
select empName, (select pm_json.projID 
                 from #project_members pm_json 
                 where pm.empName=pm_json.empName 
                 for json path, root('projList')) 
from #project_members pm
group by empName;

结果

empName projJSON
ANDY    {"projList":[{"projID":"A100"},{"projID":"B391"},{"projID":"X010"}]}
TOM     {"projList":[{"projID":"A100"},{"projID":"A510"}]}

如何从具有唯一empName和包含projID的嵌套JSON数组列的表中反序列化

select wj.empName, oj.projID
from
  #project_members_with_json wj
 cross apply
  openjson(wj.projJSON, '$.projList') with (projID    varchar(20)) oj;

结果

empName projID
ANDY    A100
ANDY    B391
ANDY    X010
TOM     A100
TOM     A510

答案 11 :(得分:0)

对于 SQL Server 2017+,使用 STRING_AGG() 函数

    SELECT STRING_AGG(Genre, ',') AS Result
    FROM Genres;

示例结果:

结果

摇滚、爵士、乡村、流行、蓝调、嘻哈、说唱、朋克