我有一个包含设备坐标时间序列的数据库(时间戳,x,y,device_id)。如何确定SQL中区域和时间范围内多个设备的最长停留时间?
以下是我所拥有的数据示例(请注意,这不是定期的)
| ts | x | y | device_id
---------------------+-----+-----+-------------
2015-10-24 14:12:39 | 0.5 | 0.5 | 1
2015-10-24 14:12:40 | 0.5 | 0.5 | 1
2015-10-24 14:12:51 | 0.5 | 0.5 | 1
2015-10-24 14:12:52 | 1.0 | 1.0 | 1
2015-10-24 14:12:53 | 1.5 | 1.5 | 1
2015-10-24 14:12:56 | 1.0 | 1.0 | 1
2015-10-24 14:12:57 | 0.5 | 0.5 | 1
2015-10-24 14:12:58 | 0.5 | 0.5 | 1
2015-10-24 14:12:39 | 0.5 | 0.5 | 2
2015-10-24 14:12:40 | 0.5 | 0.5 | 2
2015-10-24 14:12:41 | 1.0 | 1.0 | 2
2015-10-24 14:12:42 | 1.5 | 1.0 | 2
2015-10-24 14:12:45 | 2.0 | 1.0 | 2
2015-10-24 14:12:48 | 2.0 | 1.0 | 2
2015-10-24 14:12:49 | 2.0 | 1.0 | 2
此处区域(0.0,0.0)到(1.0,1.0)内设备1的停留时间为12秒(14:12:39至14:12:51)和1秒(14:12: 57至14:12:58)。设备2在同一区域内的停留时间为2秒(14:12:39至14:12:41)。最大值为12秒,最小值为1秒,平均值为5秒。
我最初的想法是在device_id上对数据进行分区以获取每个设备的集合,然后将min(ts)和max(ts)之间的持续时间确定为该设备的最长周期,然后在该时间段内执行最大值使用以下内容作为子查询跨所有设备。
SELECT (max(ts)-min(ts)) as longest_period, device_id
FROM readings
WHERE x < 1.0 AND x > 0.0 AND y < 1.0 AND y > 0.0
GROUP BY device_id, ts
答案 0 :(得分:3)
当我写这个问题时,我开始扩展我自己的想法和稍后的一些网页搜索并阅读Postgres文档(这很棒btw;)我创建了以下查询,它似乎表现得非常好并且做了我做的事情想。我承认它比我预期的要复杂一点。
select
hour,
(extract(epoch FROM max(t2.duration)))::int as max_dwell_time,
(extract(epoch FROM min(t2.duration)))::int as min_dwell_time,
(extract(epoch FROM avg(t2.duration)))::int as avg_dwell_time
from
(
select
t1.device_id,
date_trunc('hour', t1.ts) as hour,
sum(t1.duration) as duration
from
(
select
distinct(ts),
device_id,
lag(ts) over (order by ts) as prev_ts,
ts - lag(ts) over (order by ts) as duration
from
spatial_readings
where
x < 10.0 and y < 10.0
order by device_id, ts
) t1
where t1.duration < interval '60 second'
group by t1.device_id, date_trunc('hour', t1.ts)
order by t1.device_id
) as t2
group by hour
order by hour;
最内层查询(t1)使用postgres窗口函数确定时间戳之间的差距,中间查询总结小于60秒阈值的所有持续时间以及按小时和设备分组。然后,最外面的查询以秒为单位提取最大,最小和平均停留时间,并显示每小时。
以下是基于我的测试数据的示例结果
hour | max_dwell_time | min_dwell_time | avg_dwell_time
---------------------+----------------+----------------+----------------
...
2015-10-24 14:00:00 | 77 | 21 | 49
2015-10-24 15:00:00 | 177 | 109 | 143
2015-10-24 16:00:00 | 4 | 4 | 4
2015-10-24 17:00:00 | 41 | 41 | 41
2015-10-24 18:00:00 | 18 | 18 | 18
...
答案 1 :(得分:1)
这似乎可以回答您的问题,至少对于一个设备和区域:
SELECT (max(ts)-min(ts)) as longest_period, device_id
FROM readings
WHERE x < 1.0 AND x > 0.0 AND y < 1.0 AND y > 0.0
GROUP BY device_id
ORDER BY longest_period DESC
LIMIT 1;
您也可以在ts
上轻松添加所需的限制。