如何确定几何区域内的平均停留时间

时间:2015-10-24 22:58:38

标签: sql postgresql geometry time-series

我有一个包含设备坐标时间序列的数据库(时间戳,x,y,device_id)。如何确定SQL中区域和时间范围内多个设备的最长停留时间?

以下是我所拥有的数据示例(请注意,这不是定期的)

|         ts         |  x  |  y  | device_id 
---------------------+-----+-----+-------------
 2015-10-24 14:12:39 | 0.5 | 0.5 | 1
 2015-10-24 14:12:40 | 0.5 | 0.5 | 1
 2015-10-24 14:12:51 | 0.5 | 0.5 | 1
 2015-10-24 14:12:52 | 1.0 | 1.0 | 1
 2015-10-24 14:12:53 | 1.5 | 1.5 | 1
 2015-10-24 14:12:56 | 1.0 | 1.0 | 1
 2015-10-24 14:12:57 | 0.5 | 0.5 | 1
 2015-10-24 14:12:58 | 0.5 | 0.5 | 1
 2015-10-24 14:12:39 | 0.5 | 0.5 | 2
 2015-10-24 14:12:40 | 0.5 | 0.5 | 2
 2015-10-24 14:12:41 | 1.0 | 1.0 | 2
 2015-10-24 14:12:42 | 1.5 | 1.0 | 2
 2015-10-24 14:12:45 | 2.0 | 1.0 | 2
 2015-10-24 14:12:48 | 2.0 | 1.0 | 2
 2015-10-24 14:12:49 | 2.0 | 1.0 | 2

此处区域(0.0,0.0)到(1.0,1.0)内设备1的停留时间为12秒(14:12:39至14:12:51)和1秒(14:12: 57至14:12:58)。设备2在同一区域内的停留时间为2秒(14:12:39至14:12:41)。最大值为12秒,最小值为1秒,平均值为5秒。

我最初的想法是在device_id上​​对数据进行分区以获取每个设备的集合,然后将min(ts)和max(ts)之间的持续时间确定为该设备的最长周期,然后在该时间段内执行最大值使用以下内容作为子查询跨所有设备。

SELECT (max(ts)-min(ts)) as longest_period, device_id
FROM readings
WHERE x < 1.0 AND x > 0.0 AND y < 1.0 AND y > 0.0
GROUP BY device_id, ts

2 个答案:

答案 0 :(得分:3)

当我写这个问题时,我开始扩展我自己的想法和稍后的一些网页搜索并阅读Postgres文档(这很棒btw;)我创建了以下查询,它似乎表现得非常好并且做了我做的事情想。我承认它比我预期的要复杂一点。

select
  hour,
  (extract(epoch FROM max(t2.duration)))::int as max_dwell_time,
  (extract(epoch FROM min(t2.duration)))::int as min_dwell_time,
  (extract(epoch FROM avg(t2.duration)))::int as avg_dwell_time
from
  (
    select
      t1.device_id,
      date_trunc('hour', t1.ts) as hour,
      sum(t1.duration) as duration
    from
      (
        select
          distinct(ts),
          device_id,
          lag(ts) over (order by ts) as prev_ts,
          ts - lag(ts) over (order by ts) as duration
        from
          spatial_readings
        where
          x < 10.0 and y < 10.0
        order by device_id, ts
      ) t1
    where t1.duration < interval '60 second'
    group by t1.device_id, date_trunc('hour', t1.ts)
    order by t1.device_id
  ) as t2
group by hour
order by hour;

最内层查询(t1)使用postgres窗口函数确定时间戳之间的差距,中间查询总结小于60秒阈值的所有持续时间以及按小时和设备分组。然后,最外面的查询以秒为单位提取最大,最小和平均停留时间,并显示每小时。

以下是基于我的测试数据的示例结果

hour                 | max_dwell_time | min_dwell_time | avg_dwell_time 
---------------------+----------------+----------------+----------------
...
2015-10-24 14:00:00  |             77 |             21 |             49
2015-10-24 15:00:00  |            177 |            109 |            143
2015-10-24 16:00:00  |              4 |              4 |              4
2015-10-24 17:00:00  |             41 |             41 |             41
2015-10-24 18:00:00  |             18 |             18 |             18
...

答案 1 :(得分:1)

这似乎可以回答您的问题,至少对于一个设备和区域:

SELECT (max(ts)-min(ts)) as longest_period, device_id
FROM readings
WHERE x < 1.0 AND x > 0.0 AND y < 1.0 AND y > 0.0
GROUP BY device_id
ORDER BY longest_period DESC
LIMIT 1;

您也可以在ts上轻松添加所需的限制。