SQL Query从每个类别中选择底部2

时间:2009-12-17 18:20:10

标签: sql mysql greatest-n-per-group

在Mysql中,我想从每个类别中选择最底层的两个项目

Category Value
1        1.3
1        4.8
1        3.7
1        1.6
2        9.5
2        9.9
2        9.2
2        10.3
3        4
3        8
3        16

给我:

Category Value
1        1.3
1        1.6
2        9.5
2        9.2
3        4
3        8

在我从sqlite3迁移之前,我必须首先从每个类别中选择一个最低,然后排除任何加入的类别,我必须再次选择每个类别中的最低值。然后,在类别中等于新的最低或更低的任何东西都赢了。如果出现平局,这也会超过2,这很烦人......它也有很长的运行时间。

我的最终目标是计算一个人在一个类别中最低的2个中的次数(还有一个名称字段),这是我不知道该怎么做的一部分。 感谢

5 个答案:

答案 0 :(得分:8)

SELECT c1.category, c1.value
FROM catvals c1
LEFT OUTER JOIN catvals c2
  ON (c1.category = c2.category AND c1.value > c2.value)
GROUP BY c1.category, c1.value
HAVING COUNT(*) < 2;

使用您的测试数据在MySQL 5.1.41上进行测试。输出:

+----------+-------+
| category | value |
+----------+-------+
|        1 |  1.30 |
|        1 |  1.60 |
|        2 |  9.20 |
|        2 |  9.50 |
|        3 |  4.00 |
|        3 |  8.00 |
+----------+-------+

(额外的小数位是因为我将value列声明为NUMERIC(9,2)。)

与其他解决方案一样,如果存在关联,则每个类别生成2行以上。有一些方法可以构建连接条件来解决这个问题,但是我们需要在表中使用主键或唯一键,我们还必须知道打算如何绑定解决。

答案 1 :(得分:4)

你可以试试这个:

SELECT * FROM (
  SELECT c.*,
        (SELECT COUNT(*)
         FROM user_category c2
         WHERE c2.category = c.category
         AND c2.value < c.value) cnt
  FROM user_category c ) uc
WHERE cnt < 2

它应该给你想要的结果,但检查表现是否正常。

答案 2 :(得分:1)

工会应该有效。与Peter的解决方案相比,我不确定其性能。

SELECT smallest.category, MIN(smallest.value)
    FROM categories smallest
GROUP BY smallest.category
UNION
SELECT second_smallest.category, MIN(second_smallest.value)
    FROM categories second_smallest
    WHERE second_smallest.value  > (SELECT MIN(smallest.value) FROM categories smallest WHERE second.category = second_smallest.category)
GROUP BY second_smallest.category

答案 3 :(得分:1)

这是一个非常通用的解决方案,可用于为每个类别选择前n行。即使存在重复值,这也会起作用。

/* creating temporary variables */
mysql> set @cnt = 0;
mysql> set @trk = 0;

/* query */
mysql> select Category, Value 
       from (select *, 
                @cnt:=if(@trk = Category, @cnt+1, 0) cnt, 
                @trk:=Category 
                from user_categories 
                order by Category, Value ) c1 
       where c1.cnt < 2;

结果如下。

+----------+-------+
| Category | Value |
+----------+-------+
|        1 |   1.3 |
|        1 |   1.6 |
|        2 |   9.2 |
|        2 |   9.5 |
|        3 |     4 |
|        3 |     8 |
+----------+-------+

这是在MySQL 5.0.88上测试的 请注意,@ trk变量的初始值不应该是Category字段的最小值。

答案 4 :(得分:1)

这是一个正确处理重复项的解决方案。表名是'zzz',列是int和float

select
    smallest.category category, min(smallest.value) value
from 
    zzz smallest
group by smallest.category

union

select
    second_smallest.category category, min(second_smallest.value) value
from
    zzz second_smallest
where
    concat(second_smallest.category,'x',second_smallest.value)
    not in ( -- recreate the results from the first half of the union
        select concat(c.category,'x',min(c.value))
        from zzz c
        group by c.category
    )
group by second_smallest.category

order by category

注意事项:

  • 如果给定类别只有一个值,则只返回该单个条目。
  • 如果每行都有唯一的recordID,则不需要所有连接来模拟唯一键。

您的里程可能会有所不同,

- 标记