标签: python google-cloud-dataflow apache-beam
在Beam 2.3.0中,DoFn进程API需要在Beam 2.4.0中通过yield返回生成器,从进程API返回像字典这样的对象可以正常工作。
DoFn
yield
编程模型从2.3.0到2.4.0有变化吗?对于大规模Google Cloud Dataflow处理,yield(生成器)优先于DoFn流程API返回对象(list,dict)吗?
答案 0 :(得分:2)
我的理解是你想要返回一个可迭代的。因此,如果您返回字典,输出将真正是其键的列表。为了简单起见,我只坚持使用yield。