检索每个组中的最后一条记录 - MySQL

时间:2009-08-21 17:04:04

标签: sql mysql group-by greatest-n-per-group

表格messages包含如下所示的数据:

Id   Name   Other_Columns
-------------------------
1    A       A_data_1
2    A       A_data_2
3    A       A_data_3
4    B       B_data_1
5    B       B_data_2
6    C       C_data_1

如果我运行查询select * from messages group by name,我会得到结果:

1    A       A_data_1
4    B       B_data_1
6    C       C_data_1

什么查询会返回以下结果?

3    A       A_data_3
5    B       B_data_2
6    C       C_data_1

也就是说,应该返回每组中的最后一条记录。

目前,这是我使用的查询:

SELECT
  *
FROM (SELECT
  *
FROM messages
ORDER BY id DESC) AS x
GROUP BY name

但这看起来非常低效。还有其他方法可以达到同样的效果吗?

31 个答案:

答案 0 :(得分:829)

MySQL 8.0现在支持窗口函数,就像几乎所有流行的SQL实现一样。使用此标准语法,我们可以编写最大n组的查询:

WITH ranked_messages AS (
  SELECT m.*, ROW_NUMBER() OVER (PARTITION BY name ORDER BY id DESC) AS rn
  FROM messages AS m
)
SELECT * FROM ranked_messages WHERE rn = 1;

以下是我在2009年为此问题撰写的原始答案:


我用这种方式编写解决方案:

SELECT m1.*
FROM messages m1 LEFT JOIN messages m2
 ON (m1.name = m2.name AND m1.id < m2.id)
WHERE m2.id IS NULL;

关于性能,一种解决方案或另一种解决方案可能会更好,具体取决于数据的性质。因此,您应该测试两个查询,并使用性能更好的数据库。

例如,我有StackOverflow August data dump的副本。我会用它来进行基准测试。 Posts表中有1,114,357行。这是在我的Macbook Pro 2.40GHz上的MySQL 5.0.75上运行。

我会写一个查询来查找给定用户ID(我的)的最新帖子。

首先使用@Eric的技术shown和子查询中的GROUP BY

SELECT p1.postid
FROM Posts p1
INNER JOIN (SELECT pi.owneruserid, MAX(pi.postid) AS maxpostid
            FROM Posts pi GROUP BY pi.owneruserid) p2
  ON (p1.postid = p2.maxpostid)
WHERE p1.owneruserid = 20860;

1 row in set (1 min 17.89 sec)

即使EXPLAIN analysis超过16秒:

+----+-------------+------------+--------+----------------------------+-------------+---------+--------------+---------+-------------+
| id | select_type | table      | type   | possible_keys              | key         | key_len | ref          | rows    | Extra       |
+----+-------------+------------+--------+----------------------------+-------------+---------+--------------+---------+-------------+
|  1 | PRIMARY     | <derived2> | ALL    | NULL                       | NULL        | NULL    | NULL         |   76756 |             | 
|  1 | PRIMARY     | p1         | eq_ref | PRIMARY,PostId,OwnerUserId | PRIMARY     | 8       | p2.maxpostid |       1 | Using where | 
|  2 | DERIVED     | pi         | index  | NULL                       | OwnerUserId | 8       | NULL         | 1151268 | Using index | 
+----+-------------+------------+--------+----------------------------+-------------+---------+--------------+---------+-------------+
3 rows in set (16.09 sec)

现在使用LEFT JOIN使用my technique生成相同的查询结果:

SELECT p1.postid
FROM Posts p1 LEFT JOIN posts p2
  ON (p1.owneruserid = p2.owneruserid AND p1.postid < p2.postid)
WHERE p2.postid IS NULL AND p1.owneruserid = 20860;

1 row in set (0.28 sec)

EXPLAIN分析表明两个表都能够使用它们的索引:

+----+-------------+-------+------+----------------------------+-------------+---------+-------+------+--------------------------------------+
| id | select_type | table | type | possible_keys              | key         | key_len | ref   | rows | Extra                                |
+----+-------------+-------+------+----------------------------+-------------+---------+-------+------+--------------------------------------+
|  1 | SIMPLE      | p1    | ref  | OwnerUserId                | OwnerUserId | 8       | const | 1384 | Using index                          | 
|  1 | SIMPLE      | p2    | ref  | PRIMARY,PostId,OwnerUserId | OwnerUserId | 8       | const | 1384 | Using where; Using index; Not exists | 
+----+-------------+-------+------+----------------------------+-------------+---------+-------+------+--------------------------------------+
2 rows in set (0.00 sec)

这是我的Posts表的DDL:

CREATE TABLE `posts` (
  `PostId` bigint(20) unsigned NOT NULL auto_increment,
  `PostTypeId` bigint(20) unsigned NOT NULL,
  `AcceptedAnswerId` bigint(20) unsigned default NULL,
  `ParentId` bigint(20) unsigned default NULL,
  `CreationDate` datetime NOT NULL,
  `Score` int(11) NOT NULL default '0',
  `ViewCount` int(11) NOT NULL default '0',
  `Body` text NOT NULL,
  `OwnerUserId` bigint(20) unsigned NOT NULL,
  `OwnerDisplayName` varchar(40) default NULL,
  `LastEditorUserId` bigint(20) unsigned default NULL,
  `LastEditDate` datetime default NULL,
  `LastActivityDate` datetime default NULL,
  `Title` varchar(250) NOT NULL default '',
  `Tags` varchar(150) NOT NULL default '',
  `AnswerCount` int(11) NOT NULL default '0',
  `CommentCount` int(11) NOT NULL default '0',
  `FavoriteCount` int(11) NOT NULL default '0',
  `ClosedDate` datetime default NULL,
  PRIMARY KEY  (`PostId`),
  UNIQUE KEY `PostId` (`PostId`),
  KEY `PostTypeId` (`PostTypeId`),
  KEY `AcceptedAnswerId` (`AcceptedAnswerId`),
  KEY `OwnerUserId` (`OwnerUserId`),
  KEY `LastEditorUserId` (`LastEditorUserId`),
  KEY `ParentId` (`ParentId`),
  CONSTRAINT `posts_ibfk_1` FOREIGN KEY (`PostTypeId`) REFERENCES `posttypes` (`PostTypeId`)
) ENGINE=InnoDB;

答案 1 :(得分:137)

UPD:2017-03-31,MySQL的版本5.7.5默认启用了ONLY_FULL_GROUP_BY开关(因此,非确定性GROUP BY查询被禁用)。此外,他们更新了GROUP BY实施,即使使用禁用的交换机,解决方案也可能无法正常工作。需要检查。

上面的Bill Karwin的解决方案在群组中的项目数量相当小的情况下工作正常,但是当群组相当大时,查询的性能会变差,因为解决方案仅需n*n/2 + n/2 IS NULL18684446比较。

我在1182行{@ 1}}组的InnoDB表上进行了测试。该表包含功能测试的测试结果,并以(test_id, request_id)为主键。因此,test_id是一个群组,我正在为每个request_id搜索最后test_id

Bill的解决方案已经在我的dell e4310上运行了几个小时,我不知道它什么时候会完成,即使它在覆盖索引上运行(因此在EXPLAIN中using index)。

我还有其他一些基于相同想法的解决方案:

  • 如果基础索引是BTREE索引(通常是这种情况),则最大(group_id, item_value)对是每个group_id中的最后一个值,即每个group_id的第一个值我们按降序顺序浏览索引;
  • 如果我们读取索引所涵盖的值,则按索引的顺序读取值;
  • 每个索引隐式包含附加到其中的主键列(即主键位于coverage索引中)。在下面的解决方案中,我直接在主键上操作,在这种情况下,您只需要在结果中添加主键列。
  • 在很多情况下,在子查询中以所需顺序收集所需的行ID并在id上加入子查询的结果要便宜得多。因为对于子查询结果中的每一行,MySQL将需要基于主键的单个提取,子查询将首先放在连接中,并且将按子查询中的id的顺序输出行(如果我们省略显式ORDER BY加入)

3 ways MySQL uses indexes是了解一些细节的好文章。

解决方案1 ​​

这个速度非常快,我的18M +行需要大约0.8秒:

SELECT test_id, MAX(request_id), request_id
FROM testresults
GROUP BY test_id DESC;

如果要将订单更改为ASC,请将其放在子查询中,仅返回ID并将其用作子查询以连接到其余列:

SELECT test_id, request_id
FROM (
    SELECT test_id, MAX(request_id), request_id
    FROM testresults
    GROUP BY test_id DESC) as ids
ORDER BY test_id;

这个数据大约需要1,2秒。

解决方案2

这是我的桌子需要大约19秒的另一个解决方案:

SELECT test_id, request_id
FROM testresults, (SELECT @group:=NULL) as init
WHERE IF(IFNULL(@group, -1)=@group:=test_id, 0, 1)
ORDER BY test_id DESC, request_id DESC

它也按降序返回测试。由于它执行完整的索引扫描,因此速度要慢得多,但它可以让您了解如何为每个组输出N max行。

查询的缺点是查询缓存无法缓存其结果。

答案 2 :(得分:90)

使用您的subquery返回正确的分组,因为您已经到了一半。

试试这个:

select
    a.*
from
    messages a
    inner join 
        (select name, max(id) as maxid from messages group by name) as b on
        a.id = b.maxid

如果不是id你想要最大值:

select
    a.*
from
    messages a
    inner join 
        (select name, max(other_col) as other_col 
         from messages group by name) as b on
        a.name = b.name
        and a.other_col = b.other_col

这样,您可以避免子查询中的相关子查询和/或排序,这些子查询往往非常慢/效率低。

答案 3 :(得分:41)

我找到了另一个解决方案,即获取每个组中最后一篇文章的ID,然后使用第一个查询的结果作为WHERE x IN结构的参数从messages表中进行选择:< / p>

SELECT id, name, other_columns
FROM messages
WHERE id IN (
    SELECT MAX(id)
    FROM messages
    GROUP BY name
);

与其他一些解决方案相比,我不知道它的表现如何,但它对我的桌子有300多万行非常出色。 (4秒执行,1200+结果)

这应该适用于MySQL和SQL Server。

答案 4 :(得分:28)

子查询fiddle Link

的解决方案
select * from messages where id in
(select max(id) from messages group by Name)

解决方案通过加入条件fiddle link

select m1.* from messages m1 
left outer join messages m2 
on ( m1.id<m2.id and m1.name=m2.name )
where m2.id is null

这篇文章的原因是只提供小提琴链接。 其他答案中已经提供了相同的SQL。

答案 5 :(得分:8)

我还没有使用大型数据库进行测试,但我认为这可能比加入表格更快:

SELECT *, Max(Id) FROM messages GROUP BY Name

答案 6 :(得分:6)

速度相当快的方法如下。

SELECT * 
FROM messages a
WHERE Id = (SELECT MAX(Id) FROM messages WHERE a.Name = Name)

<强>结果

Id  Name    Other_Columns
3   A   A_data_3
5   B   B_data_2
6   C   C_data_1

答案 7 :(得分:6)

这是我的解决方案:

SELECT 
  DISTINCT NAME,
  MAX(MESSAGES) OVER(PARTITION BY NAME) MESSAGES 
FROM MESSAGE;

答案 8 :(得分:5)

这是两个建议。首先,如果mysql支持ROW_NUMBER(),那很简单:

WITH Ranked AS (
  SELECT Id, Name, OtherColumns,
    ROW_NUMBER() OVER (
      PARTITION BY Name
      ORDER BY Id DESC
    ) AS rk
  FROM messages
)
  SELECT Id, Name, OtherColumns
  FROM messages
  WHERE rk = 1;

我假设“最后”你的意思是最后一个顺序。如果不是,请相应地更改ROW_NUMBER()窗口的ORDER BY子句。如果ROW_NUMBER()不可用,这是另一种解决方案:

其次,如果没有,这通常是一个很好的方法:

SELECT
  Id, Name, OtherColumns
FROM messages
WHERE NOT EXISTS (
  SELECT * FROM messages as M2
  WHERE M2.Name = messages.Name
  AND M2.Id > messages.Id
)

换句话说,选择没有具有相同名称的later-Id消息的消息。

答案 9 :(得分:5)

以下是另一种使用GROUP_CONCAT使用order by和SUBSTRING_INDEX从列表中选择一条记录来获取最后一条相关记录的方法

SELECT 
  `Id`,
  `Name`,
  SUBSTRING_INDEX(
    GROUP_CONCAT(
      `Other_Columns` 
      ORDER BY `Id` DESC 
      SEPARATOR '||'
    ),
    '||',
    1
  ) Other_Columns 
FROM
  messages 
GROUP BY `Name` 

以上查询会对同一Other_Columns组中的所有Name进行分组,并使用ORDER BY id DESC按降序加入特定组中的所有Other_Columns在我的情况下提供了分隔符我使用了||,在此列表中使用SUBSTRING_INDEX将选择第一个

Fiddle Demo

答案 10 :(得分:4)

SELECT 
  column1,
  column2 
FROM
  table_name 
WHERE id IN 
  (SELECT 
    MAX(id) 
  FROM
    table_name 
  GROUP BY column1) 
ORDER BY column1 ;

答案 11 :(得分:3)

嗨@Vijay Dev,如果您的表消息包含 Id ,这是自动增量主键,然后在主键上获取最新记录,您的查询应如下所示:

SELECT m1.* FROM messages m1 INNER JOIN (SELECT max(Id) as lastmsgId FROM messages GROUP BY Name) m2 ON m1.Id=m2.lastmsgId

答案 12 :(得分:3)

您也可以从这里获取视图。

http://sqlfiddle.com/#!9/ef42b/9

第一个解决方案

SELECT d1.ID,Name,City FROM Demo_User d1
INNER JOIN
(SELECT MAX(ID) AS ID FROM Demo_User GROUP By NAME) AS P ON (d1.ID=P.ID);

第二个解决方案

SELECT * FROM (SELECT * FROM Demo_User ORDER BY ID DESC) AS T GROUP BY NAME ;

答案 13 :(得分:3)

试试这个:

SELECT jos_categories.title AS name,
       joined .catid,
       joined .title,
       joined .introtext
FROM   jos_categories
       INNER JOIN (SELECT *
                   FROM   (SELECT `title`,
                                  catid,
                                  `created`,
                                  introtext
                           FROM   `jos_content`
                           WHERE  `sectionid` = 6
                           ORDER  BY `id` DESC) AS yes
                   GROUP  BY `yes`.`catid` DESC
                   ORDER  BY `yes`.`created` DESC) AS joined
         ON( joined.catid = jos_categories.id )  

答案 14 :(得分:3)

显然,有很多不同的方法可以获得相同的结果,您的问题似乎是在MySQL中获取每个组的最后结果的有效方法。如果您正在处理大量数据并假设您正在使用InnoDB甚至最新版本的MySQL(例如5.7.21和8.0.4-rc),那么可能没有一种有效的方法。

我们有时需要对行数超过6千万的表格进行此操作。

对于这些示例,我将使用只有大约150万行的数据,其中查询需要查找数据中所有组的结果。在我们的实际情况中,我们经常需要从大约2,000个组返回数据(假设不需要检查大部分数据)。

我将使用以下表格:

CREATE TABLE temperature(
  id INT UNSIGNED NOT NULL AUTO_INCREMENT, 
  groupID INT UNSIGNED NOT NULL, 
  recordedTimestamp TIMESTAMP NOT NULL, 
  recordedValue INT NOT NULL,
  INDEX groupIndex(groupID, recordedTimestamp), 
  PRIMARY KEY (id)
);

CREATE TEMPORARY TABLE selected_group(id INT UNSIGNED NOT NULL, PRIMARY KEY(id)); 

温度表中填充了大约150万个随机记录,并包含100个不同的组。 selected_group填充了这100个组(在我们的例子中,对于所有组,这通常小于20%)。

由于此数据是随机的,因此意味着多行可以具有相同的recordedTimestamp。我们想要的是按groupID的顺序获取所有选定组的列表,每个组的最后一个记录时间戳记,如果同一组具有多个匹配的行,那么这些行的最后一个匹配的id。

如果假设MySQL有一个last()函数,它返回特殊ORDER BY子句中最后一行的值,那么我们就可以这样做:

SELECT 
  last(t1.id) AS id, 
  t1.groupID, 
  last(t1.recordedTimestamp) AS recordedTimestamp, 
  last(t1.recordedValue) AS recordedValue
FROM selected_group g
INNER JOIN temperature t1 ON t1.groupID = g.id
ORDER BY t1.recordedTimestamp, t1.id
GROUP BY t1.groupID;

在这种情况下只需要检查几百行,因为它没有使用任何正常的GROUP BY函数。这将在0秒内执行,因此效率很高。 请注意,通常在MySQL中我们会看到GROUP BY子句后面的ORDER BY子句,但是这个ORDER BY子句用于确定last()函数的ORDER,如果它在GROUP BY之后,那么它将对GROUPS进行排序。如果不存在GROUP BY子句,则所有返回的行中的最后一个值将相同。

然而,MySQL没有这个,所以让我们看看它的确有什么不同的想法,并证明这些都不是有效的。

示例1

SELECT t1.id, t1.groupID, t1.recordedTimestamp, t1.recordedValue
FROM selected_group g
INNER JOIN temperature t1 ON t1.id = (
  SELECT t2.id
  FROM temperature t2 
  WHERE t2.groupID = g.id
  ORDER BY t2.recordedTimestamp DESC, t2.id DESC
  LIMIT 1
);

这检查了3,009,254行,在5.7.21上花费了〜0.859秒,在8.0.4-rc上花了更长时间

示例2

SELECT t1.id, t1.groupID, t1.recordedTimestamp, t1.recordedValue 
FROM temperature t1
INNER JOIN ( 
  SELECT max(t2.id) AS id   
  FROM temperature t2
  INNER JOIN (
    SELECT t3.groupID, max(t3.recordedTimestamp) AS recordedTimestamp
    FROM selected_group g
    INNER JOIN temperature t3 ON t3.groupID = g.id
    GROUP BY t3.groupID
  ) t4 ON t4.groupID = t2.groupID AND t4.recordedTimestamp = t2.recordedTimestamp
  GROUP BY t2.groupID
) t5 ON t5.id = t1.id;

这检查了1,505,331行,在5.7.21上花了大约1.25秒,在8.0.4-rc上花了稍长的时间

示例3

SELECT t1.id, t1.groupID, t1.recordedTimestamp, t1.recordedValue 
FROM temperature t1
WHERE t1.id IN ( 
  SELECT max(t2.id) AS id   
  FROM temperature t2
  INNER JOIN (
    SELECT t3.groupID, max(t3.recordedTimestamp) AS recordedTimestamp
    FROM selected_group g
    INNER JOIN temperature t3 ON t3.groupID = g.id
    GROUP BY t3.groupID
  ) t4 ON t4.groupID = t2.groupID AND t4.recordedTimestamp = t2.recordedTimestamp
  GROUP BY t2.groupID
)
ORDER BY t1.groupID;

这检查了3,009,685行,在5.7.21上花费了大约1.95秒,在8.0.4-rc上花了更长时间

示例4

SELECT t1.id, t1.groupID, t1.recordedTimestamp, t1.recordedValue
FROM selected_group g
INNER JOIN temperature t1 ON t1.id = (
  SELECT max(t2.id)
  FROM temperature t2 
  WHERE t2.groupID = g.id AND t2.recordedTimestamp = (
      SELECT max(t3.recordedTimestamp)
      FROM temperature t3 
      WHERE t3.groupID = g.id
    )
);

检查了6,137,810行,在5.7.21上花费了大约2.2秒,在8.0.4-rc上花了稍长时间

示例5

SELECT t1.id, t1.groupID, t1.recordedTimestamp, t1.recordedValue
FROM (
  SELECT 
    t2.id, 
    t2.groupID, 
    t2.recordedTimestamp, 
    t2.recordedValue, 
    row_number() OVER (
      PARTITION BY t2.groupID ORDER BY t2.recordedTimestamp DESC, t2.id DESC
    ) AS rowNumber
  FROM selected_group g 
  INNER JOIN temperature t2 ON t2.groupID = g.id
) t1 WHERE t1.rowNumber = 1;

检查了6,017,808行,在8.0.4-rc上花了大约4.2秒

示例6

SELECT t1.id, t1.groupID, t1.recordedTimestamp, t1.recordedValue 
FROM (
  SELECT 
    last_value(t2.id) OVER w AS id, 
    t2.groupID, 
    last_value(t2.recordedTimestamp) OVER w AS recordedTimestamp, 
    last_value(t2.recordedValue) OVER w AS recordedValue
  FROM selected_group g
  INNER JOIN temperature t2 ON t2.groupID = g.id
  WINDOW w AS (
    PARTITION BY t2.groupID 
    ORDER BY t2.recordedTimestamp, t2.id 
    RANGE BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING
  )
) t1
GROUP BY t1.groupID;

这检查了6,017,908行,并在8.0.4-rc上花费了大约17.5秒

示例7

SELECT t1.id, t1.groupID, t1.recordedTimestamp, t1.recordedValue 
FROM selected_group g
INNER JOIN temperature t1 ON t1.groupID = g.id
LEFT JOIN temperature t2 
  ON t2.groupID = g.id 
  AND (
    t2.recordedTimestamp > t1.recordedTimestamp 
    OR (t2.recordedTimestamp = t1.recordedTimestamp AND t2.id > t1.id)
  )
WHERE t2.id IS NULL
ORDER BY t1.groupID;

这是永远的,所以我不得不杀了它。

答案 15 :(得分:2)

根据您的问题,以下查询可以正常使用。

SELECT M1.* 
FROM MESSAGES M1,
(
 SELECT SUBSTR(Others_data,1,2),MAX(Others_data) AS Max_Others_data
 FROM MESSAGES
 GROUP BY 1
) M2
WHERE M1.Others_data = M2.Max_Others_data
ORDER BY Others_data;

答案 16 :(得分:2)

如果您想要每个Name的最后一行,那么您可以按Name为每个行组分配一个行号,并按Id按降序排序。

<强> QUERY

SELECT t1.Id, 
       t1.Name, 
       t1.Other_Columns
FROM 
(
     SELECT Id, 
            Name, 
            Other_Columns,
    (
        CASE Name WHEN @curA 
        THEN @curRow := @curRow + 1 
        ELSE @curRow := 1 AND @curA := Name END 
    ) + 1 AS rn 
    FROM messages t, 
    (SELECT @curRow := 0, @curA := '') r 
    ORDER BY Name,Id DESC 
)t1
WHERE t1.rn = 1
ORDER BY t1.Id;

SQL Fiddle

答案 17 :(得分:2)

我们有什么方法可以使用此方法删除表中的重复项?结果集基本上是唯一记录的集合,所以如果我们可以删除不在结果集中的所有记录,我们实际上没有重复项?我试过这个,但mySQL给出了1093错误。

DELETE FROM messages WHERE id NOT IN
 (SELECT m1.id  
 FROM messages m1 LEFT JOIN messages m2  
 ON (m1.name = m2.name AND m1.id < m2.id)  
 WHERE m2.id IS NULL)

有没有办法可以将输出保存到临时变量然后从NOT IN(临时变量)中删除? @Bill感谢您提供非常有用的解决方案。

编辑:想想我找到了解决方案:

DROP TABLE IF EXISTS UniqueIDs; 
CREATE Temporary table UniqueIDs (id Int(11)); 

INSERT INTO UniqueIDs 
    (SELECT T1.ID FROM Table T1 LEFT JOIN Table T2 ON 
    (T1.Field1 = T2.Field1 AND T1.Field2 = T2.Field2 #Comparison Fields  
    AND T1.ID < T2.ID) 
    WHERE T2.ID IS NULL); 

DELETE FROM Table WHERE id NOT IN (SELECT ID FROM UniqueIDs);

答案 18 :(得分:1)

我们将研究如何使用MySQL获取记录分组依据中的最后一条记录。例如,如果您有此结果集。

id category_id post_title

1 1 Title 1

2 1 Title 2

3 1 Title 3

4 2 Title 4

5 2 Title 5

6 3 Title 6

我希望能够获得标题3,标题5和标题6每个类别中的最后一个帖子。要按类别获取帖子,您将使用MySQL Group By键盘。

select * from posts group by category_id

但是我们从该查询中得到的结果是。

id category_id post_title

1 1 Title 1

4 2 Title 4

6 3 Title 6

group by将始终返回结果集中该组中的第一条记录。

SELECT id, category_id, post_title FROM posts WHERE id IN ( SELECT MAX(id) FROM posts GROUP BY category_id );

这将返回每个组中ID最高的帖子。

id category_id post_title

3 1 Title 3

5 2 Title 5

6 3 Title 6

Reference Click Here

答案 19 :(得分:1)

MariaDB 10.3 及更高版本,使用 GROUP_CONCAT

这个想法是使用 ORDER BY + LIMIT

SELECT GROUP_CONCAT(id ORDER BY id DESC LIMIT 1) AS id,
       name,
       GROUP_CONCAT(Other_columns ORDER BY id DESC LIMIT 1) AS Other_columns
FROM t
GROUP BY name;

db<>fiddle demo

答案 20 :(得分:1)

SELECT * FROM table_name在哪里primary_key IN(SELECT MAX(primary_key)FROM table_name GROUP BY column_name)

答案 21 :(得分:1)

如果性能确实是您的关注,您可以在名为IsLastInGroup的BIT类表上引入一个新列。

在最后一列上将其设置为true,并在每行插入/更新/删除时对其进行维护。写入会比较慢,但是你会在阅读上受益。这取决于您的使用案例,只有在您专注于阅读时我才会推荐它。

所以你的查询看起来像:

SELECT * FROM Messages WHERE IsLastInGroup = 1

答案 22 :(得分:1)

这个怎么样:

SELECT DISTINCT ON (name) *
FROM messages
ORDER BY name, id DESC;

我有类似的问题(关于postgresql艰难)和1M记录表。这个解决方案需要1.7s vs 44s由LEFT JOIN生成。 在我的情况下,我必须根据NULL值过滤 name 字段的对应关系,从而在0.2秒内获得更好的性能

答案 23 :(得分:1)

select * from messages group by name desc

答案 24 :(得分:0)

您可以通过计数分组,也可以得到分组的最后一项,例如:

SELECT 
    user,
    COUNT(user) AS count,
    MAX(id) as last
FROM request 
GROUP BY user

答案 25 :(得分:0)

您看过https://github.com/fhulufhelo/Get-Last-Record-in-Each-MySQL-Group吗? 它对我有用

$sql = "SELECT c.id, c.name,  c.email, r.id, r.companyid, r.name,  r.email FROM companytable c LEFT JOIN ( SELECT * FROM revisiontable  WHERE id  IN ( SELECT MAX(id)  FROM revisiontable  GROUP BY companyid ))  r ON a.cid=b.r.id";

答案 26 :(得分:0)

**

嗨,此查询可能有帮助:

**

SELECT 
  *
FROM 
  message 

WHERE 
  `Id` IN (
    SELECT 
      MAX(`Id`) 
    FROM 
      message 
    GROUP BY 
      `Name`
  ) 
ORDER BY 
   `Id` DESC

答案 27 :(得分:0)

另一种方法:

在每个程序中查找最大m2_price的属性(1个程序中有n个属性):

select * from properties p
join (select max(m2_price) as max_price from properties group by program_id) p2
having p.m2_price = max_price

答案 28 :(得分:0)

希望下面的Oracle查询可以提供帮助:

WITH Temp_table AS
(
    Select id, name, othercolumns, ROW_NUMBER() over (PARTITION BY name ORDER BY ID 
    desc)as rank from messages
)
Select id, name,othercolumns from Temp_table where rank=1

答案 29 :(得分:0)

我在https://dzone.com/articles/get-last-record-in-each-mysql-group中找到了最佳解决方案

select * from `data` where `id` in (select max(`id`) from `data` group by `name_id`)

答案 30 :(得分:0)

那:

select *, max(id) from messages group by name 

我已经在sqlite上对其进行了测试,它会返回所有列和所有名称的最大id值。