从bigquery命令行工具缓存BigQuery

时间:2013-09-28 13:21:43

标签: caching google-bigquery

我正在使用bigquery命令行工具。如何通过BigQuery命令行工具启用缓存。

2 个答案:

答案 0 :(得分:4)

自动缓存查询,但以下情况除外:

  • 使用非确定性函数的查询,例如now()或rand()不会被缓存。
  • 未缓存指定目标表的查询(如果您在目标表中获得了结果,则不需要缓存)。
  • 当任何源表更改时,将刷新缓存的结果。
  • 结果仅缓存24小时。

您可以通过查询查询中的作业对象来查看此内容。例如:

$ bq query select 17
Waiting on bqjob_r4c80a6944b4dff0_0000014165a4f730_1 ... (0s) Current status: DONE
+-----+
| f0_ |
+-----+
|  17 |
+-----+

这实际上运行了查询并将其添加到缓存中。现在让我们再次运行它:

$ bq query select 17
Waiting on bqjob_r27fa3d897b8dfb3e_0000014165a66b50_1 ... (0s) Current status: DONE
+-----+
| f0_ |
+-----+
|  17 |
+-----+

该查询结果应该从缓存中获取。这将在作业资源上的statistics.query.cacheHit成员中可见。我们来看看:

$ bq --format=prettyjson show -j bqjob_r27fa3d897b8dfb3e_0000014165a66b50_1
{
  "configuration": {
    "query": {
      ...
      "query": "select 17",
    }
  },
  ...
  "statistics": {
    "creationTime": "1380389907722",
    "endTime": "1380389908018",
    "query": {
      "cacheHit": true,
      "totalBytesProcessed": "0"
    },
    "startTime": "1380389907853",
  },
}

答案 1 :(得分:0)

https://cloud.google.com/bigquery/docs/cached-results中所述:

  • 默认情况下启用缓存
  • 它对新查询无效
  • 您可以使用--nouse_cache标志从命令行禁用缓存