BigQuery

时间:2018-02-09 00:11:28

标签: google-cloud-platform google-bigquery

我想知道在BigQuery中使用分区表的用法是什么。似乎大多数查询似乎花费大约相同的时间来完成而不管大小(忽略极端,我推广),这主要是使用它来降低处理的字节的成本,或者是什么BQ中分区表的主要用例?

https://cloud.google.com/bigquery/docs/creating-column-partitions

1 个答案:

答案 0 :(得分:2)

有多种好处,主要是成本。

  • 通过编写查询来读取,例如:7天的分区而不是7年,您的成本更低
  • 以90天以上的时间内触摸的分区成本较低
  • 您可以清楚地重新加载一天的数据,而不是解决问题
  • 你仍然建议你使用YEARly表格,例如mytable_2018,但你不再需要每日表格,例如:mytable_20180101,这进一步导致查询更简单,读取超过1000个表格也不再是问题(这是一个硬限制。)
  • 修改架构时,需要修改几个表,不再需要在数千个表上更改脚本
  • 这也意味着它处理的爱好者字节在云平台上可以更好地优化并且需要更少的资源
  • 通过将数据重新组织到分区表中,查询时间将来会受益。随着客户将移动数据,云工程团队将优化服务以更好地使用。
  • 如果现有数据至少为几TB,您会看到明显的成本效益。