我在 PostgreSQL 数据库中有表。
下表显示了英格兰城市每个地下车站的火车每小时速度:
DATE_KEY | STATION | CITY | SPEED
-------------------------------------------------------
2018-10-01 00:00:00 | Arsenal | London | 1078.125
2018-10-01 01:00:00 | Arsenal | London | 877.222
2018-10-01 02:00:00 | Arsenal | London | 1127.752
2018-10-01 00:00:00 | Beckton | London | 2866.375
2018-10-01 01:00:00 | Beckton | London | 1524.375
2018-10-01 02:00:00 | Beckton | London | 1618.533
2018-10-01 00:00:00 | Chesham | Liverpool | 1567.588
2018-10-01 01:00:00 | Chesham | Liverpool | 792.333
2018-10-01 02:00:00 | Chesham | Liverpool | 1138.857
2018-10-01 00:00:00 | Farringdon | Liverpool | 1543.625
2018-10-01 01:00:00 | Farringdon | Liverpool | 538.666
2018-10-01 02:00:00 | Farringdon | Liverpool | 1587.583
我正在尝试获取这样的聚合数据:
DATE_KEY | CITY | AVG_SPEED
----------------------------------------------------
2018-10-01 00:00:00 | London | 852.125
2018-10-01 01:00:00 | London | 750.222
2018-10-01 02:00:00 | London | 625.752
2018-10-01 00:00:00 | Liverpool | 804.588
2018-10-01 01:00:00 | Liverpool | 792.333
2018-10-01 02:00:00 | Liverpool | 952.857
换句话说,我因此需要城市中火车速度的每小时平均(AVG)。
答案 0 :(得分:1)
我认为您所需要的只是将AVG函数与group by子句一起使用:
SELECT DATE_KEY, CITY, AVG(SPEED) as AVG_SPEED
FROM table
GROUP BY DATE_KEY, CITY
答案 1 :(得分:1)
我知道问题中提到的数据集是小时值,如果您想计算不同时间戳的平均值(例如“ 2018-10-01 02:45:08”),则可以像这样每小时平均速度-
select DATE_TRUNC('day', a.DATE_KEY)+cast(DATE_PART('hour',a.DATE_KEY) as Integer)/1*INTERVAL '1 hour' as hour_key, city, avg(speed) as avg_speed
FROM table1 a group by 1, 2;