如何从BigQuery流式传输更新?

时间:2019-06-20 10:04:27

标签: google-bigquery

当数据到达我的BigQuery时,我想将其中的一些数据发送到另一个数据库-一个数据集市或为实时仪表板提供服务的可操作数据库。

我该怎么做?轮询巨大的BQ表太昂贵且太慢,我希望更新频繁-接近实时。

奇怪的是,我从BigQuery中找不到有关流的信息。

1 个答案:

答案 0 :(得分:1)

  

轮询巨大的BQ表太昂贵且太慢了

请确保按天对数据进行分区,如果数据过多,请按小时对数据进行群集。

没有一种自然的方法可以在BigQuery到达时将数据从BigQuery中流出来,但是如果您对数据进行适当的分区和群集,则扫描的费用将比从朴素的表中花费的费用少。

实时:是否可以选择将数据从管道拆分到BigQuery和其他工具,而不是将其存储在BQ中之后?


发表评论

  

“我宁愿不更改每个客户端以写入两个目标,即BQ和PubSub”

让每个客户端仅写入Pub / Sub。然后单击以部署从Pub / Sub-BigQuery写入BigQuery的管道,以获取最可靠的管道。然后其他使用者可以订阅提供BigQuery的同一发布/订阅主题。