我每5分钟记录一次TIMESTAMP气象数据,我希望每15分钟进行一次分组。我发现下面的发言权函数看起来很有希望,但是BQ不支持UNIX_TIMESTAMP函数
SELECT
FLOOR(UNIX_TIMESTAMP(utc_timestamp)/(15 * 60)) AS timekey
GROUP BY
timekey
最好的方法是什么?
答案 0 :(得分:1)
以下是用于BigQuery标准SQL
#standardSQL
SELECT
TIMESTAMP_SECONDS(15*60 * DIV(UNIX_SECONDS(utc_timestamp), 15*60)) timekey,
AVG(metric) metric
FROM `project.dataset.table`
GROUP BY timekey
您可以使用下面的示例中的虚拟数据来测试,玩游戏
#standardSQL
WITH `project.dataset.table` AS (
SELECT TIMESTAMP '2019-03-15 00:00:00' utc_timestamp, 1 metric UNION ALL
SELECT '2019-03-15 00:05:00', 2 UNION ALL
SELECT '2019-03-15 00:10:00', 3 UNION ALL
SELECT '2019-03-15 00:15:00', 4 UNION ALL
SELECT '2019-03-15 00:20:00', 5 UNION ALL
SELECT '2019-03-15 00:25:00', 6 UNION ALL
SELECT '2019-03-15 00:30:00', 7 UNION ALL
SELECT '2019-03-15 00:35:00', 8 UNION ALL
SELECT '2019-03-15 00:40:00', 9
)
SELECT
TIMESTAMP_SECONDS(15*60 * DIV(UNIX_SECONDS(utc_timestamp), 15*60)) timekey,
AVG(metric) metric
FROM `project.dataset.table`
GROUP BY timekey
-- ORDER BY timekey
有结果
Row timekey metric
1 2019-03-15 00:00:00 UTC 2.0
2 2019-03-15 00:15:00 UTC 5.0
3 2019-03-15 00:30:00 UTC 8.0
很明显,您可以使用逻辑要求的任何聚合-我只是为了示例而使用了AVG()