我可以在MySQL中进行GROUP BY,但是在分组时忽略空值,必要时删除结果行吗?

时间:2014-06-23 19:03:54

标签: mysql group-by left-join

我的桌子:

T1

col_a  col_b
1       100    
1       200
1       300
2       400

T2

col_a  col_b
100      5
100      6

T3

col_a  col_b
5       100
6       200
6       300

如果我运行查询并按顺序离开加入3个表:

1   100  5     100
1   100  6     200
1   100  6     300
1   200  null  null
1   300  null  null
2   400  null  null

如果我按t1.col_a,t2.col_b:

添加组
1   100           5      100
1   100           6      (200 or 300)
1   (200 or 300)  null   null
2   400           null   null

但我不想显示第3行,因为它在t2.col_b中没有值。我可以添加一个条件到该列不为null的位置,但这将删除需要保留的最后一行。

在一个完美的查询中,我希望看到:

1   100           5      100
1   100           6      (200 or 300)
2   400           null   null

2 个答案:

答案 0 :(得分:0)

试试这个。 t1.col_b有点棘手,因为如果存在多个t1.col_a值且没有引用t2,则此查询为此选择一个随机数。

SELECT
    sub.col_a,
    IFNULL(sub.relation,t1.col_b),
    t2.col_b,
    t3.col_b
FROM(
    SELECT 
        t1.col_a,
        group_concat(DISTINCT t2.col_a) AS relation 
    FROM table1 AS t1
    LEFT JOIN table2 AS t2 ON t2.col_a = t1.col_b
    GROUP BY t1.col_a
) AS sub
LEFT JOIN table1 AS t1
    ON t1.col_a = sub.col_a
    AND (t1.col_b IN (sub.relation) OR sub.relation IS NULL)
LEFT JOIN table2 AS t2
    ON t2.col_a = t1.col_b
LEFT JOIN table3 AS t3
    ON t3.col_a = t2.col_b
GROUP BY t1.col_a, t2.col_b

答案 1 :(得分:0)

一种方法是仅选择非空行作为结果的一部分,然后将其与更广泛但又分组的结果集合在一起:

SELECT * FROM t1
 JOIN t2 ON t1.col_b = t2.col_a
 LEFT JOIN t3 ON t2.col_b = t3.col_a

UNION

SELECT * FROM t1
  LEFT JOIN t2 ON t1.col_b = t2.col_a
  LEFT JOIN t3 ON t2.col_b = t3.col_a
GROUP BY t1.col_a

请注意,第一个查询没有LEFT JOIN。那是因为我们不希望在该查询中出现任何NULL结果。该查询为您提供:

t1.col_a    t2.col_a    t3.col_a    t3.col_b
   1           100          5         100
   1           100          6         200
   1           100          6         300

第二个查询给你:

t1.col_a    t2.col_a    t3.col_a    t3.col_b
   1           100          5         100
   2           400         NULL       NULL

最后,当您执行UNION时,它会删除重复的结果(第一个结果集中的第一行等于第二个结果集中的第一行)。这是UNION command的默认行为,导致:

t1.col_a    t2.col_a    t3.col_a    t3.col_b
   1           100          5         100
   1           100          6         200
   1           100          6         300
   2           400         NULL       NULL