避免大查询热身发生的活动

时间:2014-08-11 16:28:26

标签: google-bigquery

在流媒体数据文章中,提及"在几小时不活动之后,在下一次插入期间将再次发生预热期。" https://developers.google.com/bigquery/streaming-data-into-bigquery

那些可以保持连接温暖的活动是什么? 我正在编写连接池,它应该提供bigquery对象,可以在没有任何预热期间放入数据。

2 个答案:

答案 0 :(得分:1)

数据是否正在升温。它只被添加到队列中,以便在实例恢复运行后插入到BQ中。文档说需要两分钟。因此您可以毫无后顾之忧地插入,但无法在前两分钟查询该特定数据。如果你需要它不断地活动,任何活动都会使实例保持运行,所以你可以安排一个cron在一小时内做一个非常小的读取。 (我不确定从保存的表结果中读取是否会使实例保持活动状态,很可能不会;但我不确定。缓存结果也一样。)

我不认为担心它会引起如此大的担忧。通常使用流式数据,您没有长时间完全不活动。如果是这样,您可以考虑只进行正常的批处理作业。

答案 1 :(得分:1)

流媒体文档中讨论的预热期与最近查询到表的流记录是否对查询可见,而不是表是否立即接受流记录有关。如果表格是新的或者没有通过流式传输接收记录数小时,那么在生成查询结果时扫描这些新流式记录可能需要2分钟。

除非您的使用模式是每隔几个小时仅流式传输记录然后立即查询,否则这不应该是一个问题。即使是每小时的少量流式传输记录也足以让桌子保持温暖状态。在这种情况下。