要检查表格是否存在,我们可以使用此查询,它非常便宜:
#legacySql
SELECT last_modified_time FROM {dataset}.__TABLES__ WHERE table_id='{table}'
LIMIT 1
是否有任何类似的廉价查询来检查分区是否为空?
据我所知,我可以在where子句中使用带有_PARTITIONTIME的select,但它最终将处理分区中的所有数据(如果存在),而不管limit子句如何。我要检查是否存在多个分区,它必须采用查询形式,而不是API请求。
我可能会多次运行cronjobs,但我想将数据写入分区,只有它是空的。
答案 0 :(得分:2)
#legacySql
SELECT
partition_id
FROM
[DATASET.TABLE$__PARTITIONS_SUMMARY__]
WHERE
partition_id = "20171224"
有关详情,请参阅:https://cloud.google.com/bigquery/docs/querying-partitioned-tables
答案 1 :(得分:2)
以下查询与$ 0一样便宜,因此您可以安全地使用此方法来识别任何分区中的行数
#standardSQL
SELECT _PARTITIONTIME AS pt, COUNT(1) cnt
FROM `yourproject.yourdataset.yourpartitionedtable`
GROUP BY pt
HAVING pt = TIMESTAMP('2016-12-11')
另一个选项如下 - 如果partition为空它实际返回0,否则返回分区中的行数
#standardSQL
SELECT IFNULL((
SELECT COUNT(1) FROM `yourproject.yourdataset.yourpartitionedtable`
GROUP BY _PARTITIONTIME HAVING _PARTITIONTIME = TIMESTAMP('2016-11-11')
), 0) cnt