如何使用Google BigQuery按时间间隔分组

时间:2019-03-15 22:57:37

标签: mysql google-bigquery

我每5分钟记录一次TIMESTAMP气象数据,我希望每15分钟进行一次分组。我发现下面的发言权函数看起来很有希望,但是BQ不支持UNIX_TIMESTAMP函数

SELECT
    FLOOR(UNIX_TIMESTAMP(utc_timestamp)/(15 * 60)) AS timekey
GROUP BY
    timekey

最好的方法是什么?

1 个答案:

答案 0 :(得分:1)

以下是用于BigQuery标准SQL

#standardSQL
SELECT 
  TIMESTAMP_SECONDS(15*60 * DIV(UNIX_SECONDS(utc_timestamp), 15*60)) timekey,
  AVG(metric) metric
FROM `project.dataset.table`
GROUP BY timekey

您可以使用下面的示例中的虚拟数据来测试,玩游戏

#standardSQL
WITH `project.dataset.table` AS (
  SELECT TIMESTAMP '2019-03-15 00:00:00' utc_timestamp, 1 metric UNION ALL
  SELECT '2019-03-15 00:05:00', 2 UNION ALL
  SELECT '2019-03-15 00:10:00', 3 UNION ALL
  SELECT '2019-03-15 00:15:00', 4 UNION ALL
  SELECT '2019-03-15 00:20:00', 5 UNION ALL
  SELECT '2019-03-15 00:25:00', 6 UNION ALL
  SELECT '2019-03-15 00:30:00', 7 UNION ALL
  SELECT '2019-03-15 00:35:00', 8 UNION ALL
  SELECT '2019-03-15 00:40:00', 9 
)
SELECT 
  TIMESTAMP_SECONDS(15*60 * DIV(UNIX_SECONDS(utc_timestamp), 15*60)) timekey,
  AVG(metric) metric
FROM `project.dataset.table`
GROUP BY timekey
-- ORDER BY timekey  

有结果

Row timekey                 metric   
1   2019-03-15 00:00:00 UTC 2.0  
2   2019-03-15 00:15:00 UTC 5.0  
3   2019-03-15 00:30:00 UTC 8.0   

很明显,您可以使用逻辑要求的任何聚合-我只是为了示例而使用了AVG()