为什么在Scio中你更喜欢聚合而不是groupByKey?

时间:2018-05-11 22:24:46

标签: scala apache-beam dataflow spotify-scio

自:

https://github.com/spotify/scio/wiki/Scio-data-guideline

“首选组合/聚合/减少变换over groupByKey。请记住,reduce操作必须是关联和可交换的。”

为什么特别喜欢聚合而不是groupByKey?

0 个答案:

没有答案