使用可空字段在BigQuery表上查询性能

时间:2013-04-12 20:26:28

标签: google-bigquery

我们需要将数据从我们的日志上传到Google BigQuery,并且我们有两个日志数据子集,在查询时不会重叠。

  1. 第一个子集有一个字段“vendor_id”,将在WHERE子句中使用很多。
  2. 第二个子集是没有“vendor_id”的日志条目
  3. 我们只能创建一个具有可为空的“vendor_id”字段的表,或者为每个子集创建一个两个不同的表。这些方法的表现有什么不同吗?

    此致

    利奥

1 个答案:

答案 0 :(得分:2)

您提到的两个选项之间的查询性能差异很小(如果有)。也就是说,查询的成本与读取的数据量成正比,因此如果您有两个单独的表,则可能会更便宜,因为每个查询都会读取较少量的数据。