如何基于三列选择MAX行

时间:2015-02-06 11:37:33

标签: mysql sql max greatest-n-per-group

我的表定义如下

软件

software_uid  name 
-------------|----------
1            | word 
2            | excel

平台

platform_uid  name 
-------------|----------
1            | windows 
2            | osx

下载

CREATE TABLE IF NOT EXISTS `downloads` (
`id` int(11) NOT NULL,
`software_uid` int(11) NOT NULL,
`platform_uid` int(11) NOT NULL,
`version` decimal(2,1) NOT NULL,
`build` varchar(32) COLLATE utf8_unicode_ci NOT NULL,
`path` varchar(128) COLLATE utf8_unicode_ci NOT NULL,
`date_added` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP
) ENGINE=InnoDB AUTO_INCREMENT=6 DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;

以下是下载表中的一些数据:

INSERT INTO `downloads` (`id`, `software_uid`, `platform_uid`, `version`, `build`, `path`, `date_added`) VALUES (1, 1, 1, '0.4', 'Alpha 1', 'downloads/word0.4a1win.zip', '2015-02-06 08:15:09'),
(2, 1, 2, '0.4', 'Alpha 1', 'downloads/word0.4a1osx.zip', '2015-02-06 08:29:47'),
(4, 1, 1, '0.5', 'Beta', 'downloads/word0.5bwin.zip', '2015-02-06 08:29:52'),
(5, 2, 1, '0.1', 'PreAlpha', 'downloads/excel0.1pawin.zip', '2015-02-06 09:14:32');

我想从表中提取两种类型的数据(基本上是两个查询):

  1. 将显示所有平台的所有软件的最新版本
  2. 一个用于排除第一个的其他下载
  3. 并在最后添加软件和平台表中的名称。

    我已经开始构建几个级别的子查询并进入一个非常讨厌的查询:

    SELECT `name`,`path`,`os`,`version`,`build` 
    FROM `platform` AS s4 
    JOIN 
    ( 
        SELECT * 
        FROM `software` AS `s2` 
        JOIN 
        ( 
            SELECT 
               `software_uid` AS `guid`, `platform_uid`, MAX(`version`) AS `version`, 
               `path`, `build` 
            FROM `downloads` 
            GROUP BY `platform_uid`, `software_uid` 
        ) AS `s1` ON `s1`.`guid`=`s2`.`software_uid`
    ) 
    AS s3 ON s3.`platform_uid` = s4.`platform_uid`;
    

    正确地给了一些字段。 GROUP BY子句是问题的根源,或者确切地说,执行的第一个子查询没有按预期获取结果,因为它没有正确定义。

    我做错了什么?

1 个答案:

答案 0 :(得分:0)

当您使用group by时,您不应该有任何既不在group by也不在聚合函数中的字段。因此,pathbuild在子查询中是不合适的。相反,你必须将它们带入另一个join。仅仅因为你做max()并不意味着其他字段来自同一行。

SELECT `name`,`path`,`os`, d.`version`, d.`build` 
FROM platform p  JOIN 
     software s
     on s.`platform_uid` = p.`platform_uid` JOIN
     (SELECT `software_uid` AS `guid`, `platform_uid`,
             MAX(`version`) AS `version`
      FROM `downloads` 
      GROUP BY `software_uid`, `platform_uid`
     ) dd
     ON s.`guid`= dd.`software_uid` join
     downloads d
     on d.software_uid = dd.guid and d.platform_uid = dd.platfrom_uid and
        d.version = dd.version;

此外,您在命名冲突方面存在问题 - name位于多个表中。您应始终使用表别名来限定列名称。我用表名的缩写替换了你的别名;这样可以更容易地遵循查询逻辑。