数据流批处理或流式处理插入BigQuery的说明

时间:2018-12-31 17:19:46

标签: google-cloud-dataflow apache-beam dataflow

鉴于向BigQuery进行流插入会涉及成本,从BigQuery角度来看,使用Dataflow从有界集合(或批处理模式)中读取会产生成本吗?而且我相信仅当从Unbounded集合中读取(以流模式)并写入BigQuery时,才被认为是BigQuery的流插入吗?

1 个答案:

答案 0 :(得分:1)

您是正确的,specified in the sources

  

如果输入是有界的,则将使用文件加载。如果输入是   无限,那么将使用流插入。

您可以通过使用.setMethod(Write.Method.FILE_LOADS)构建器对象上的.setMethod(Write.Method.STREAMING_INSERTS)BigQueryIO覆盖默认行为。