DoFn进程返回类型

时间:2018-03-29 18:01:04

标签: python google-cloud-dataflow apache-beam

在Beam 2.3.0中,DoFn进程API需要在Beam 2.4.0中通过yield返回生成器,从进程API返回像字典这样的对象可以正常工作。

编程模型从2.3.0到2.4.0有变化吗?对于大规模Google Cloud Dataflow处理,yield(生成器)优先于DoFn流程API返回对象(list,dict)吗?

1 个答案:

答案 0 :(得分:2)

我的理解是你想要返回一个可迭代的。因此,如果您返回字典,输出将真正是其键的列表。为了简单起见,我只坚持使用yield。