Google Big Query数据衡量

时间:2017-04-07 23:58:17

标签: google-bigquery

在Google Big Query中,如果我针对某个视图运行查询,它会告诉我扫描了多少数据来回答它。 (BQ账单是这个的函数)。

然而,有没有办法在BQ环境中查看我有多少数据而不查询项目中存在的任何多个视图?我的目标是每天测量BQ中的数据量。

1 个答案:

答案 0 :(得分:4)

以下希望能让您了解如何快速检查特定数据集的库存 您可以扩展此逻辑以合并多个数据集并执行您感兴趣的任何聚合

   
#legacySQL
SELECT table_id,
    DATE(creation_time/1000) AS creation_date,
    DATE(last_modified_time/1000) AS last_modified_date,
    row_count,
    size_bytes,
    CASE
        WHEN type = 1 THEN 'table'
        WHEN type = 2 THEN 'view'
        WHEN type = 3 THEN 'external'
        ELSE '?'
    END AS type,
    TIMESTAMP(creation_time/1000) AS creation_time,
    TIMESTAMP(last_modified_time/1000) AS last_modified_time,
    dataset_id,
    project_id
FROM [project.dataset1.__TABLES__],   
     [project.dataset2.__TABLES__],
     [project.dataset3.__TABLES__],
     [project.dataset4.__TABLES__],
     [project.dataset5.__TABLES__]

取决于数据集的大小(就其中的表数而言),在某些点以上查询可以开始抱怨。所以你可能需要批量你的统计数据。希望这有帮助