在 SQL Server 2005 中模拟group_concat Microsoft MySQL 函数?

Simulating group_concat MySQL function in Microsoft SQL Server 2005?

提问人:DanM 提问时间:1/17/2009 最后编辑:DanM 更新时间:7/14/2023 访问量:192469

问:

我正在尝试将基于MySQL的应用程序迁移到Microsoft SQL Server 2005(不是选择,但这就是生活)。

在最初的应用程序中,我们几乎完全使用了符合ANSI-SQL的语句,但有一个明显的例外 - 我们相当频繁地使用MySQL的功能。group_concat

group_concat顺便说一句,这样做:给定一个表格,比如说,员工姓名和项目......

SELECT empName, projID FROM project_members;

返回:

ANDY   |  A100
ANDY   |  B391
ANDY   |  X010
TOM    |  A100
TOM    |  A510

...以下是您从 group_concat 获得的内容:

SELECT 
    empName, group_concat(projID SEPARATOR ' / ') 
FROM 
    project_members 
GROUP BY 
    empName;

返回:

ANDY   |  A100 / B391 / X010
TOM    |  A100 / A510

所以我想知道的是:是否可以在 SQL Server 中编写一个用户定义的函数来模拟 ?group_concat

我几乎没有使用 UDF、存储过程或类似东西的经验,只是直接使用 SQL,所以请犯太多解释:)

sql sql-server sql-server-2005 字符串聚合

评论

0赞 bernhof 9/3/2011
几个方便的链接:postgresonline.com/journal/archives/191-stringagg.htmlconsultingblogs.emc.com/jamiethomson/archive/2009/07/16/......
0赞 Tomas 8/3/2013
如何使用 SQL 查询创建逗号分隔列表的可能副本? - 那篇文章更广泛,所以我会选择那篇作为规范的
0赞 Trikaldarshiii 8/15/2013
SQL Server 中 SQL group_concat 函数的可能重复项
0赞 Steve Ford 3/21/2014
你怎么知道列表应该按哪个顺序构建,例如,你显示 A100 / B391 / X010,但鉴于关系数据库中没有隐式排序,它可以很容易地是 X010 / A100 / B391 或任何其他组合。
0赞 Diego 3/20/2012
这是一个老问题,但我喜欢这里给出的 CLR 解决方案

答:

179赞 BradC 1/17/2009 #1

没有真正简单的方法可以做到这一点。不过,有很多想法。

我发现的最好的一个

SELECT table_name, LEFT(column_names , LEN(column_names )-1) AS column_names
FROM information_schema.columns AS extern
CROSS APPLY
(
    SELECT column_name + ','
    FROM information_schema.columns AS intern
    WHERE extern.table_name = intern.table_name
    FOR XML PATH('')
) pre_trimmed (column_names)
GROUP BY table_name, column_names;

或者,如果数据可能包含以下字符,则正常工作的版本<

WITH extern
     AS (SELECT DISTINCT table_name
         FROM   INFORMATION_SCHEMA.COLUMNS)
SELECT table_name,
       LEFT(y.column_names, LEN(y.column_names) - 1) AS column_names
FROM   extern
       CROSS APPLY (SELECT column_name + ','
                    FROM   INFORMATION_SCHEMA.COLUMNS AS intern
                    WHERE  extern.table_name = intern.table_name
                    FOR XML PATH(''), TYPE) x (column_names)
       CROSS APPLY (SELECT x.column_names.value('.', 'NVARCHAR(MAX)')) y(column_names) 

评论

1赞 PhilChuang 1/23/2010
这个例子对我有用,但我尝试做另一个聚合,它不起作用,给了我一个错误:“相关名称'pre_trimmed'在 FROM 子句中多次指定。
7赞 Koen 3/13/2012
“pre_trimmed”只是子查询的别名。别名是子查询所必需的,并且必须是唯一的,因此对于另一个子查询,请将其更改为唯一...
2赞 S.Mason 11/18/2017
你能展示一个没有table_name列名的例子吗,这很令人困惑。
10赞 GregTSmith 1/28/2010 #2

使用以下代码,您必须在部署之前对项目属性进行设置,并通过运行 将数据库更改为信任外部代码(请务必在其他地方阅读有关安全风险和替代方案 [如证书]) 的信息。PermissionLevel=ExternalALTER DATABASE database_name SET TRUSTWORTHY ON

using System;
using System.Collections.Generic;
using System.Data.SqlTypes;
using System.IO;
using System.Runtime.Serialization;
using System.Runtime.Serialization.Formatters.Binary;
using Microsoft.SqlServer.Server;

[Serializable]
[SqlUserDefinedAggregate(Format.UserDefined,
    MaxByteSize=8000,
    IsInvariantToDuplicates=true,
    IsInvariantToNulls=true,
    IsInvariantToOrder=true,
    IsNullIfEmpty=true)]
public struct CommaDelimit : IBinarySerialize
{
    [Serializable]
    private class StringList : List<string>
    { }

    private StringList List;

    public void Init()
    {
        this.List = new StringList();
    }

    public void Accumulate(SqlString value)
    {
        if (!value.IsNull)
            this.Add(value.Value);
    }

    private void Add(string value)
    {
        if (!this.List.Contains(value))
            this.List.Add(value);
    }

    public void Merge(CommaDelimit group)
    {
        foreach (string s in group.List)
        {
            this.Add(s);
        }
    }

    void IBinarySerialize.Read(BinaryReader reader)
    {
        IFormatter formatter = new BinaryFormatter();
        this.List = (StringList)formatter.Deserialize(reader.BaseStream);
    }

    public SqlString Terminate()
    {
        if (this.List.Count == 0)
            return SqlString.Null;

        const string Separator = ", ";

        this.List.Sort();
 
        return new SqlString(String.Join(Separator, this.List.ToArray()));
   }

   void IBinarySerialize.Write(BinaryWriter writer)
   {
        IFormatter formatter = new BinaryFormatter();
        formatter.Serialize(writer.BaseStream, this.List);
    }
}

我已经使用如下所示的查询对此进行了测试:

SELECT 
 dbo.CommaDelimit(X.value) [delimited] 
FROM 
 (
  SELECT 'D' [value] 
  UNION ALL SELECT 'B' [value] 
  UNION ALL SELECT 'B' [value] -- intentional duplicate
  UNION ALL SELECT 'A' [value] 
  UNION ALL SELECT 'C' [value] 
 ) X 

产量:A、B、C、D

52赞 J Hardiman 2/24/2010 #3

现在可能为时已晚,无法受益,但这难道不是最简单的做事方法吗?

SELECT     empName, projIDs = replace
                          ((SELECT Surname AS [data()]
                              FROM project_members
                              WHERE  empName = a.empName
                              ORDER BY empName FOR xml path('')), ' ', REQUIRED SEPERATOR)
FROM         project_members a
WHERE     empName IS NOT NULL
GROUP BY empName

评论

0赞 DanM 2/26/2010
有趣。我已经完成了手头的项目,但我会尝试这种方法。谢谢!
7赞 Mark Elliot 7/15/2010
不错的技巧 - 唯一的问题是对于带有空格的姓氏,它会用分隔符替换空格。
0赞 J Hardiman 7/26/2010
我自己也遇到过这样的问题,马克。不幸的是,在MSSQL与时俱进并引入GROUP_CONCAT之前,这是我能够为这里需要的东西提出的开销密集型方法中最少的。
0赞 fleed 9/25/2015
谢谢你!下面是一个 SQL Fiddle,显示它正在工作: sqlfiddle.com/#!6/c5d56/3
7赞 user422190 8/17/2010 #4

关于 J Hardiman 的回答,怎么样:

SELECT empName, projIDs=
  REPLACE(
    REPLACE(
      (SELECT REPLACE(projID, ' ', '-somebody-puts-microsoft-out-of-his-misery-please-') AS [data()] FROM project_members WHERE empName=a.empName FOR XML PATH('')), 
      ' ', 
      ' / '), 
    '-somebody-puts-microsoft-out-of-his-misery-please-',
    ' ') 
  FROM project_members a WHERE empName IS NOT NULL GROUP BY empName

顺便问一下,使用“姓氏”是错别字还是我不明白这里的概念?

无论如何,非常感谢大家,因为它为我节省了相当多的时间:)

评论

1赞 Tim Meers 3/20/2012
如果你问我,相当不友好的回答,作为一个答案根本没有帮助。
1赞 user422190 6/4/2013
现在才看到......我不是故意的,当时我对 sql server(现在仍然如此)感到非常沮丧。这篇文章的答案实际上很有帮助;编辑:顺便说一句,为什么它没有帮助?它为我起了作用
8赞 isoughtajam 10/8/2010 #5

尝试了这些,但就我在 MS SQL Server 2005 中的目的而言,以下内容最有用,我在 xaprb 上找到了

declare @result varchar(8000);

set @result = '';

select @result = @result + name + ' '

from master.dbo.systypes;

select rtrim(@result);

@Mark正如你提到的,是太空角色给我带来了问题。

评论

0赞 phil_w 3/27/2019
我认为引擎并不能真正保证这种方法的任何顺序,因为变量是根据 exec 计划计算为数据流的。不过,到目前为止,它似乎大部分时间都有效。
175赞 Scott 5/13/2011 #6

我可能有点晚了,但这个 STUFF() + FOR XML 方法对我有用,并且比 COALESCE 方法更容易。

SELECT STUFF(
             (SELECT ',' + Column_Name 
              FROM Table_Name
              FOR XML PATH (''))
             , 1, 1, '')

评论

1赞 DJDave 1/11/2018
这仅显示了如何连接值 - group_concat按组连接它们,这更具挑战性(以及 OP 似乎需要什么)。有关如何执行此操作,请参阅对 SO 15154644 的公认答案 - WHERE 子句是关键添加
0赞 John Cummings 2/28/2019
@DJDave指的是这个答案。另请参阅类似问题的公认答案
12赞 Cmaly 6/28/2011 #7

要连接具有多个项目经理的项目中的所有项目经理名称,请写:

SELECT a.project_id,a.project_name,Stuff((SELECT N'/ ' + first_name + ', '+last_name FROM projects_v 
where a.project_id=project_id
 FOR
 XML PATH(''),TYPE).value('text()[1]','nvarchar(max)'),1,2,N''
) mgr_names
from projects_v a
group by a.project_id,a.project_name
35赞 MaxiWheat 12/22/2012 #8

看看 Github 上的GROUP_CONCAT项目,我想我所做的正是您正在寻找的:

此项目包含一组 SQLCLR 用户定义的聚合函数 (SQLCLR UDA),它们共同提供与 MySQL GROUP_CONCAT 函数类似的功能。有多种功能可以根据所需的功能确保最佳性能......

评论

2赞 Steve Lam 10/30/2015
@MaxiWheat:很多人在点击投票之前没有仔细阅读问题或答案。由于他们的错误,它直接影响了所有者的帖子。
0赞 Jan 10/31/2018
效果很好。我缺少的唯一功能是能够对MySQL group_concat()可以像这样的列进行排序:GROUP_CONCAT(klascode,'(',name,')' ORDER BY klascode ASC SEPARATOR ', ')
59赞 Martin Smith 11/19/2016 #9

SQL Server 2017SQL Server 2017SQL Server 2017SQL Server 2017SQL Server 2017SQL Server 2017SQL Server 2017SQL Server

STRING_AGG(表达式、分隔符)。

连接字符串表达式的值和位置分隔符 它们之间的值。分隔符不添加在字符串的末尾。

可以通过追加来对连接的元素进行排序WITHIN GROUP (ORDER BY some_expression)

对于版本 2005-2016我通常在接受的答案中使用 XML 方法。

但是,在某些情况下,这可能会失败。例如,如果要连接的数据包含您看到的CHAR(29)

FOR XML 无法序列化数据...因为它 包含 XML 中不允许使用的字符 (0x001D)。

可以处理所有字符的更可靠的方法是使用 CLR 聚合。但是,使用这种方法对串联元素应用排序更加困难。

不能保证为变量赋值的方法,应避免在生产代码中使用。

评论

0赞 Simon_Weaver 9/14/2017
这在 Azure SQL 中也可用:azure.microsoft.com/en-us/roadmap/...
0赞 krock 3/21/2019 #10

对于我的 Google 同事来说,这是一个非常简单的即插即用解决方案,在为更复杂的解决方案苦苦挣扎了一段时间后,它对我有用:

SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ CONVERT(VARCHAR(10), projID ) 
                     FROM returns 
                     WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM 
returns t

请注意,我必须将 ID 转换为 VARCHAR 才能将其连接为字符串。如果您不必这样做,这里有一个更简单的版本:

SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ projID
                     FROM returns 
                     WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM 
returns t

所有功劳都归功于这里:https://social.msdn.microsoft.com/Forums/sqlserver/en-US/9508abc2-46e7-4186-b57f-7f368374e084/replicating-groupconcat-function-of-mysql-in-sql-server?forum=transactsql

-1赞 Abdus Salam Azad 7/23/2021 #11

对于 SQL Server 2017+,请使用 STRING_AGG() 函数

    SELECT STRING_AGG(Genre, ',') AS Result
    FROM Genres;

示例结果:

结果

摇滚,爵士,乡村,流行,蓝调,嘻哈,说唱,朋克

评论

4赞 Andriy M 7/27/2021
有效的解决方案,但已经有人建议
4赞 evilReiko 9/30/2021 #12

2021

@AbdusSalamAzad的答案是正确的。

SELECT STRING_AGG(my_col, ',') AS my_result FROM my_tbl;

如果结果太大,您可能会收到错误“STRING_AGG聚合结果超出了 8000 字节的限制。使用 LOB 类型以避免结果截断“,这可以通过将查询更改为以下命令来修复:

SELECT STRING_AGG(convert(varchar(max), my_col), ',') AS my_result FROM my_tbl;

评论

1赞 Andriy M 10/11/2021
既然已经发布了这么多答案,我认为最好将关于 8000 字节限制问题的完全有效的注释以及解决方案合并到第一个建议STRING_AGG的答案中。