如何在MySQL中返回数据透视表输出?

How can I return pivot table output in MySQL?

提问人:peku 提问时间:10/6/2011 最后编辑:Rick Jamespeku 更新时间:8/28/2023 访问量:471319

问:

如果我有一个MySQL表,如下所示:

company_name    action  pagecount
-------------------------------
Company A       PRINT   3
Company A       PRINT   2
Company A       PRINT   3
Company B       EMAIL   
Company B       PRINT   2
Company B       PRINT   2
Company B       PRINT   1
Company A       PRINT   3

是否可以运行MySQL查询来获得如下输出:

company_name    EMAIL   PRINT 1 pages   PRINT 2 pages   PRINT 3 pages
-------------------------------------------------------------
CompanyA        0       0               1               3
CompanyB        1       1               2               0

这个想法是可以变化的,因此输出列数量应该反映这一点,每/对一列,然后是每 .我不确定这是否被称为数据透视表,但有人建议这样做?pagecountactionpagecountcompany_name

MySQL SQL 数据 透视表

评论

5赞 N.B. 10/6/2011
这被称为透视,在 SQL 之外进行这种转换要快得多。
1赞 Dave Rix 10/6/2011
Excel撕裂了这样的东西,这在MySQL中真的很困难,因为没有“CROSSTAB”运算符:(
0赞 peku 10/6/2011
是的,它目前是在 Excel 中手动完成的,我们正在尝试将其自动化。
0赞 giannis christofakis 9/28/2015
@N.B.是建议在我们的应用层中执行它,还是在那里执行它更简单?
1赞 N.B. 9/28/2015
@giannischristofakis - 这真的取决于你和你的同事认为什么更简单。自从我发表评论以来(4 年),技术已经赶上了很多,所以这完全取决于你觉得更好的地方——无论是在应用程序还是 SQL 中。例如,在我的工作中,我们处理类似的问题,但我们结合了 SQL 和应用内方法。基本上,除了给出自以为是的答案之外,我无法帮助你,这不是你需要的:)

答:

282赞 Bjoern 10/6/2011 #1

基本上是一个数据透视表。

可以在此处找到有关如何实现此目的的出色教程: http://www.artfulsoftware.com/infotree/qrytip.php?id=78

我建议您阅读这篇文章并根据您的需求调整此解决方案。

更新

在上面的链接目前不再可用之后,我觉得有义务为在这里搜索mysql枢轴答案的所有人提供一些额外的信息。它确实有大量的信息,我不会把那里的所有东西都放在这里(甚至更多,因为我只是不想复制他们丰富的知识),但我会给出一些关于如何处理数据透视表的建议,通常以 peku 的例子为例,他首先提出了这个问题。

也许链接很快就会回来,我会密切关注它。

电子表格方式...

为此,许多人只是使用MSExcel,OpenOffice或其他电子表格工具等工具。这是一个有效的解决方案,只需将数据复制到那里并使用 GUI 提供的工具来解决此问题。

但。。。这不是问题,它甚至可能导致一些缺点,例如如何将数据放入电子表格、有问题的缩放等。

SQL方式...

鉴于他的表格看起来像这样:

CREATE TABLE `test_pivot` (
  `pid` bigint(20) NOT NULL AUTO_INCREMENT,
  `company_name` varchar(32) DEFAULT NULL,
  `action` varchar(16) DEFAULT NULL,
  `pagecount` bigint(20) DEFAULT NULL,
  PRIMARY KEY (`pid`)
) ENGINE=MyISAM;

现在看看他/她想要的表:

company_name    EMAIL   PRINT 1 pages   PRINT 2 pages   PRINT 3 pages
-------------------------------------------------------------
CompanyA        0       0               1               3
CompanyB        1       1               2               0

行 (, ) 类似于条件。主要分组是 。EMAILPRINT x pagescompany_name

为了设置条件,这更像是使用 CASE 语句。为了按某物分组,好吧,使用......GROUP BY

提供此透视的基本 SQL 可能如下所示:

SELECT  P.`company_name`,
    COUNT(
        CASE 
            WHEN P.`action`='EMAIL' 
            THEN 1 
            ELSE NULL 
        END
    ) AS 'EMAIL',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '1' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 1 pages',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '2' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 2 pages',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '3' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 3 pages'
FROM    test_pivot P
GROUP BY P.`company_name`;

这应该可以非常快速地提供所需的结果。这种方法的主要缺点是,数据透视表中的行数越多,需要在 SQL 语句中定义的条件就越多。

这也可以处理,因此人们倾向于使用准备好的语句、例程、计数器等。

有关此主题的一些其他链接:

评论

5赞 Lykegenes 6/20/2014
该链接目前似乎有效......如果它再次宕机,请尝试以下方法:Google的缓存 webcache.googleusercontent.com/...或Internet Wayback Machine(web.archive.org/web/20070303120558*/artfulsoftware.com/infotree/queries.php)
0赞 MrPandav 12/29/2015
链接可通过此 URL 访问 artfulsoftware.com/infotree/qrytip.php?id=78
1赞 user2513149 10/17/2016
还有另一种方法可以在不使用“if”、“case”或“GROUP_CONCAT”的情况下生成数据透视表:en.wikibooks.org/wiki/MySQL/Pivot_table
0赞 Caius Jard 5/10/2020
您可以从 CASE 中删除 ELSE NULL,因为 hat 是默认行为(并且条件聚合足够冗长)
107赞 RRM 9/26/2013 #2

我的解决方案是在没有任何透视的 T-SQL 中:

SELECT
    CompanyName,  
    SUM(CASE WHEN (action='EMAIL') THEN 1 ELSE 0 END) AS Email,
    SUM(CASE WHEN (action='PRINT' AND pagecount=1) THEN 1 ELSE 0 END) AS Print1Pages,
    SUM(CASE WHEN (action='PRINT' AND pagecount=2) THEN 1 ELSE 0 END) AS Print2Pages,
    SUM(CASE WHEN (action='PRINT' AND pagecount=3) THEN 1 ELSE 0 END) AS Print3Pages
FROM 
    Company
GROUP BY 
    CompanyName

评论

2赞 itsols 10/10/2014
即使在 PostgreSQL 上,这也对我有用。我更喜欢这种方法,而不是在 Postgres 上使用交叉表扩展,因为这更干净
7赞 Raymond Nijland 3/26/2019
“我的解决方案在 T-SQL 中,没有任何透视:”不仅是 SQL Server,它还应该在遵循 ANSI SQL 标准的大多数数据库供应商上运行。请注意,只有当您需要透视字符串时,才能使用数值数据SUM()MAX()
4赞 kajacx 3/2/2020
我认为 CASE 是不必要的,您可以这样做,因为条件将转换为 when true 和 when falseSUM(CASE WHEN (action='PRINT' AND pagecount=1) THEN 1 ELSE 0 END)SUM(action='PRINT' AND pagecount=1)10
2赞 Caius Jard 5/10/2020
@kajacx是的,尽管在没有这种布尔操作的数据库上需要它。在“适用于所有 dB 的较长语法”和“仅适用于......”之间的选择。我会选择前者
0赞 Vilq 8/3/2023
小心!!!这是该页面上的最佳答案:我浏览了 Bjoern 的答案,它很棒,但是现在您必须处理full_group_by等等,因此它仅适用于传统模式!
4赞 irba 11/27/2013 #3
select t3.name, sum(t3.prod_A) as Prod_A, sum(t3.prod_B) as Prod_B, sum(t3.prod_C) as    Prod_C, sum(t3.prod_D) as Prod_D, sum(t3.prod_E) as Prod_E  
from
(select t2.name as name, 
case when t2.prodid = 1 then t2.counts
else 0 end  prod_A, 

case when t2.prodid = 2 then t2.counts
else 0 end prod_B,

case when t2.prodid = 3 then t2.counts
else 0 end prod_C,

case when t2.prodid = 4 then t2.counts
else 0 end prod_D, 

case when t2.prodid = "5" then t2.counts
else 0 end prod_E

from 
(SELECT partners.name as name, sales.products_id as prodid, count(products.name) as counts
FROM test.sales left outer join test.partners on sales.partners_id = partners.id
left outer join test.products on sales.products_id = products.id 
where sales.partners_id = partners.id and sales.products_id = products.id group by partners.name, prodid) t2) t3

group by t3.name ;
89赞 M Khalid Junaid 7/26/2014 #4

对于MySQL,您可以直接在函数中放置条件,它将被评估为布尔值01,因此您可以根据自己的条件进行计数,而无需使用语句SUM()IF/CASE

SELECT
    company_name,  
    SUM(action = 'EMAIL')AS Email,
    SUM(action = 'PRINT' AND pagecount = 1)AS Print1Pages,
    SUM(action = 'PRINT' AND pagecount = 2)AS Print2Pages,
    SUM(action = 'PRINT' AND pagecount = 3)AS Print3Pages
FROM t
GROUP BY company_name

DEMO

评论

1赞 itsols 10/9/2014
这是一个非常整洁的。您知道这是否符合其他平台(如 Postgres)的标准吗?
3赞 M Khalid Junaid 10/10/2014
@itsols 否,仅适用于特定于 Mysql 的
0赞 Erwin Brandstetter 11/17/2014
@itsols:我添加了另一个标准 SQL 版本。Postgres 还有一个专用的 crosstab() 函数。
2赞 SBF 1/9/2017
也适用于 SQLite
48赞 Abhishek Gupta 10/10/2014 #5

对于动态透视,请与 一起使用。 GROUP_CONCAT 函数将组中的字符串连接成一个具有各种选项的字符串。GROUP_CONCATCONCAT

SET @sql = NULL;
SELECT
    GROUP_CONCAT(DISTINCT
    CONCAT(
      'SUM(CASE WHEN action = "',
      action,'"  AND ', 
           (CASE WHEN pagecount IS NOT NULL 
           THEN CONCAT("pagecount = ",pagecount) 
           ELSE pagecount IS NULL END),
      ' THEN 1 ELSE 0 end) AS ',
      action, IFNULL(pagecount,'')
      
    )
  )
INTO @sql
FROM
  t;

SET @sql = CONCAT('SELECT company_name, ', @sql, ' 
                  FROM t 
                   GROUP BY company_name');

PREPARE stmt FROM @sql;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;

在这里演示

评论

4赞 Abhishek Gupta 8/19/2015
Pacerier,真正的人,但对于动态枢轴来说,这是最好的方法之一
3赞 Patrick Murphy 2/2/2018
如果您的“操作”列中有许多值,或者希望该列表随着时间的推移而增长,则这很有效,因为为每个值编写 case 语句可能很耗时且难以保持最新状态。
0赞 Daniele 6/19/2023
它返回以下错误:“MySQL 的查询面板中不允许使用 DDL 和 DML 语句;只允许使用 SELECT 语句。将 DDL 和 DML 放在 schema 面板中。
32赞 Erwin Brandstetter 11/17/2014 #6

使用布尔逻辑的标准 SQL 版本:

SELECT company_name
     , COUNT(action = 'EMAIL' OR NULL) AS "Email"
     , COUNT(action = 'PRINT' AND pagecount = 1 OR NULL) AS "Print 1 pages"
     , COUNT(action = 'PRINT' AND pagecount = 2 OR NULL) AS "Print 2 pages"
     , COUNT(action = 'PRINT' AND pagecount = 3 OR NULL) AS "Print 3 pages"
FROM   tbl
GROUP  BY company_name;

db<>fiddle 这里
旧的sqlfiddle

如何?

TRUE OR NULL收益 率。
收益 率。
收益 率。
而 COUNT 只计算非 null 值。瞧。
TRUEFALSE OR NULLNULLNULL OR NULLNULL

评论

1赞 Pacerier 4/2/2015
@Erwin,但是你怎么知道有三列呢?如果有 5 个怎么办?10?20?
2赞 Erwin Brandstetter 4/2/2015
@Pacerier:问题中的例子似乎表明了这一点。无论哪种方式,SQL 都需要知道返回类型。完全动态的查询是不可能的。如果输出列的数量可能会有所不同,则需要执行两个步骤:首先构建查询,第二:执行查询。
10赞 Peter Green 12/31/2014 #7

有一个叫做MySQL数据透视表生成器的工具,它可以帮助您创建一个基于Web的数据透视表,您可以稍后将其导出到excel(如果您愿意)。如果数据位于单个表或多个表中,则可以工作。

您需要做的就是指定列的数据源(它支持动态列)、行、表正文中的值和表关系(如果有的话)MySQL Pivot Table

此工具的主页 https://mysqlreports.com/mysql-reporting-tools/mysql-pivot-table/

19赞 Talha 12/19/2016 #8

正确答案是:

select table_record_id,
group_concat(if(value_name='note', value_text, NULL)) as note
,group_concat(if(value_name='hire_date', value_text, NULL)) as hire_date
,group_concat(if(value_name='termination_date', value_text, NULL)) as termination_date
,group_concat(if(value_name='department', value_text, NULL)) as department
,group_concat(if(value_name='reporting_to', value_text, NULL)) as reporting_to
,group_concat(if(value_name='shift_start_time', value_text, NULL)) as shift_start_time
,group_concat(if(value_name='shift_end_time', value_text, NULL)) as shift_end_time
from other_value
where table_name = 'employee'
and is_active = 'y'
and is_deleted = 'n'
GROUP BY table_record_id

评论

1赞 Patrick Murphy 2/2/2018
这只是你手头的一个例子吗?表格的结构是什么?other_value
2赞 Raymond Nijland 6/19/2019
“正确答案是:”很可能不是,因为它缺少增加 defualt 值的查询,该值在 1024 之后限制为 1024 GROUP_CONCAT GROUP_CONCAT只是截断字符串而不会出现错误,这意味着可能会发生意外结果。SET
0赞 Talha 8/31/2019
对不起,伙计们不记得更多细节了。我做一些事情是为了好玩,然后忘记或破坏了整个项目。但是当我偶然发现一个挑战时,我会分享我是如何解决它的方法。我知道我的例子不是很详细,但我想它可能会给那些知道自己要面对什么的人指明方向:)
0赞 Barbaros Özhan 11/1/2020 #9

一种选择是结合使用 CASE。WHEN语句在MySQL数据库的聚合中是冗余的,并动态考虑所需的查询生成以及获取结果集的正确列标题,如以下代码块所示:

SET @sql = NULL;

SELECT GROUP_CONCAT(
             CONCAT('SUM( `action` = ''', action, '''',pc0,' ) AS ',action,pc1)
       )
  INTO @sql
  FROM 
  ( 
   SELECT DISTINCT `action`, 
          IF(`pagecount` IS NULL,'',CONCAT('page',`pagecount`)) AS pc1,
          IF(`pagecount` IS NULL,'',CONCAT(' AND `pagecount` = ', pagecount, '')) AS pc0
     FROM `tab` 
    ORDER BY CONCAT(action,pc0) 
  ) t;

SET @sql = CONCAT('SELECT company_name,',@sql,' FROM `tab` GROUP BY company_name'); 
SELECT @sql; 

PREPARE stmt FROM @sql;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;

Demo

0赞 SurajSingh444 6/12/2021 #10
SELECT company_name, SUM(CASE WHEN ACTION = 'Email' THEN 1 ELSE 0 END) AS "Email",
SUM(CASE WHEN ACTION = 'Print' AND pagecount = 1 THEN 1 ELSE 0 END) AS "print 1 PAGE",
SUM(CASE WHEN ACTION = 'Print' AND pagecount = 2 THEN 1 ELSE 0 END) AS "print 2 PAGE",
SUM(CASE WHEN ACTION = 'Print' AND pagecount = 3 THEN 1 ELSE 0 END) AS "print 2 PAGE"
FROM test1 GROUP BY company_name;