在下面的查询中,我使用PostgreSQL计算两小时间隔的最小值,最大值和平均值。
即使是开始时间(..04:00:00+05:30)
,查询也能正常运行,但它的结果与奇数开始时间(..05:00:00+05:30)
的开始时间相似。
多重乘2返回甚至几小时,这是问题。
SELECT tagid, CAST(sample_time_stamp as Date) AS stat_date,
(floor(extract(hour from sample_time_stamp)/2) * 2)::int AS hrs,
min(sensor_reading) AS theMin,
max(sensor_reading) AS theMax,
avg(sensor_reading) AS theAvg
FROM sensor_readings WHERE tagid =1 AND
sample_time_stamp BETWEEN '2012-10-23 01:00:00+05:30'
AND '2012-10-23 05:59:00+05:30'
GROUP BY tagid,CAST(sample_time_stamp as Date),
floor(extract(hour from sample_time_stamp)/2) * 2
ORDER BY tagid,stat_date, hrs
tagid date hrs theMin themax theAvg
1 2012-10-23 0 6 58 30.95
1 2012-10-23 2 2 59 29.6916666666667
1 2012-10-23 4 3 89 31.7666666666667
tagid date hrs theMin themax theAvg
1 2012-10-23 2 2 59 29.6916666666667
1 2012-10-23 4 3 89 31.7666666666667
答案 0 :(得分:3)
从最小时间戳开始获取恒定的时间范围:
WITH params AS (
SELECT '2012-10-23 01:00:00+05:30'::timestamptz AS _min -- input params
,'2012-10-23 05:59:00+05:30'::timestamptz AS _max
,'2 hours'::interval AS _interval
)
,ts AS (SELECT generate_series(_min, _max, _interval) AS t_min FROM params)
,timeframe AS (
SELECT t_min
,lead(t_min, 1, _max) OVER (ORDER BY t_min) AS t_max
FROM ts, params
)
SELECT s.tagid
,t.t_min
,t.t_max -- mildly redundant except for last row
,min(s.sensor_reading) AS the_min
,max(s.sensor_reading) AS the_max
,avg(s.sensor_reading) AS the_avg
FROM timeframe t
LEFT JOIN sensor_readings s ON s.tagid = 1
AND s.sample_time_stamp >= t.t_min
AND s.sample_time_stamp < t.t_max
GROUP BY 1,2,3
ORDER BY 1,2;
可用于任何时间范围和任何间隔长度。需要PostgreSQL 8.4或更高版本。
如果最大时间戳_max
未落在_min + n * _interval
上,则会截断最后一个时间范围。因此,最后一行可以表示比您想要的_interval
更短的时间范围。
Common Table Expressions (CTE),方便处理。在顶部CTE params
输入参数值一次。
generate_series()
了解创建时间栅格的时间间隔。
Window function lead(...)
包含3个参数(包括默认值) - 以涵盖最后一行的特殊情况。
LEFT JOIN
,因此没有匹配数据的时间帧仍会显示在结果中(NULL
值为数据)。
这也是以后编辑的原因:WHERE
条件必须移至LEFT JOIN
条件才能实现。
WITH RECURSIVE params AS (
SELECT '2012-10-23 01:00:00+05:30'::timestamptz AS _min -- input params
,'2012-10-23 05:59:00+05:30'::timestamptz AS _max
,'2 hours'::interval AS _interval
)
, timeframe AS (
SELECT _min AS t_min, LEAST(_min + _interval, _max) AS t_max
FROM params
UNION ALL
SELECT t_max, LEAST(t_max + _interval, _max)
FROM timeframe t, params p
WHERE t_max < _max
)
SELECT ...
稍快一点......接受你的选择 -> sqlfiddle显示两者。
请注意,即使声明WITH RECURSIVE
,您也可以使用非递归 CTE(另外)。
应该比原始查询更快。一半的代码处理生成时间栅格,这涉及几行并且非常快。处理实际的表行(昂贵的部分)变得更便宜,因为我们不再计算每个sample_time_stamp
的新值。
你绝对应该拥有multi-column index形式:
CREATE INDEX foo_idx ON sensor_readings (tagid, sample_time_stamp DESC);
我假设你经常查询最近的条目(后来的时间戳),我使用DESC
。如果不是这样,则删除修饰符。两种方式都没有太大的区别。