依靠GROUP BY以及结果总数

时间:2018-12-26 10:42:11

标签: sql postgresql group-by count

我有三个表:

users只有两列:id: INT, name: TEXT

houses包含三列:id: INT, user_id: INT, sold_at: DATE

users_with_house_permissions有两列:id: INT, user_id: INT

我有这个查询,可以找到用户出售的房屋数量(只要它具有house_permissions):

SELECT users.id as user_id, COUNT(*) as houses_sold
FROM users
JOIN users_with_house_permissions hp ON hp.user_id = users.id
LEFT JOIN houses on houses.user_id = users.id AND houses.sold_at IS NOT NULL
GROUP BY users.id

现在,如何获得此返回的总行数?我正在尝试进行分页,我需要知道此查询将返回的总行数。

例如,如果我具有以下内容:

users (id, name):

1, John
2, Carla
3, Bula

users_with_house_permissions (id, user_id):

1, 1
2, 2

houses (id, user_id, sold_at):

1, 1, '2018-10-10'

我希望查询的结果是:

user_id: 1
houses_sold: 1
total_count: 2

user_id: 2
houses_sold: 0
total_count: 2

因此,total_count将代表此查询将返回的行数。

3 个答案:

答案 0 :(得分:1)

您可以在下面尝试-标量子查询

SELECT users.id as user_id, COUNT(*) as houses_sold,(select count(*) from users_with_house_permissions a) as totalcount
FROM users
JOIN users_with_house_permissions hp ON hp.user_id = users.id
LEFT JOIN houses on houses.user_id = users.id AND houses.sold_at IS NOT NULL
GROUP BY users.id

答案 1 :(得分:1)

您可以在没有任何分区的情况下使用分析/窗口函数计数:

SELECT users.id as user_id, COUNT(*) as houses_sold,

  COUNT(*) OVER() as total_count -- count of rows returned by query

FROM users
JOIN users_with_house_permissions hp ON hp.user_id = users.id
LEFT JOIN houses on houses.user_id = users.id AND houses.sold_at IS NOT NULL
GROUP BY users.id

它的工作原理与任何其他分析功能相同;它计入一个分区,但如果未指定分区,则计入整个数据集。在这种情况下,转换是在完成分组之后完成的,因此,count(*)会计算组中的项目数,而count(*) over()会计算数据集中的组数

其他人发布了sum(count(*)) over(),这等效于在对行进行分组之前对行进行计数。如果您有“谁卖了房子”的数据集,它就这样了:

john
john
john
mary

已售出4栋房屋,约翰售出3栋,玛丽售出1栋。该代理商有2个销售代表。

COUNT(*) FROM ... GROUP BY name给出“约翰卖出3,玛丽卖出1”并得出以下数据集:

john, 3
mary, 1

如果要求和,那么我们将有4,即3 + 1。这实际上是完成分组之前的房屋数量。因此,SUM(COUNT(*)) OVER()是我们进行分组之前的行数。重要的是要记住,COUNT(*)属于GROUP BY,并且将成为一个整数,然后由SUM OVER求和。看看我们是否使用了子查询可能会更容易:

SELECT name, the_count, SUM(the_count) OVER()
FROM (SELECT name, count(*) as the_count FROM sales GROUP BY name) subquery

但是,由于分析是在分组后计算的,因此实际上并不需要这样显示;数据库将以与执行操作相同的方式执行此操作:

SELECT name, count(*), sum(count(*)) over() FROM sales GROUP BY name

这样一来,您可以理解在执行分组后应用了分析,这意味着COUNT(*) OVER()是分组操作完成后数据集中行数的计数。分组产生了john,3|mary,1,因此COUNT(*)OVER()产生了2-数据集中的行数

如果您想了解更多信息,该文档的标题为“ Windows函数”,可以在以下位置找到:https://www.postgresql.org/docs/9.1/tutorial-window.html

这是针对PG 9.1的;记得将视图更改为您特定的PG版本

答案 2 :(得分:0)

我相信你想要

select uhp.user_id, count(h.id) as houses_sold,
       sum(count(h.id)) over () as total_count
from users_with_house_permissions left join
     houses h
     on h.user_id = uhp.user_id
group by uhp.user_id;

您似乎不需要users表,因为您只希望users_with_house_permissions中的用户。

count()对匹配的行数进行计数,因此您可以获得0计数的行。然后,窗口函数将获取所有行的总数。