标签: scala apache-beam dataflow spotify-scio
自:
https://github.com/spotify/scio/wiki/Scio-data-guideline
“首选组合/聚合/减少变换over groupByKey。请记住,reduce操作必须是关联和可交换的。”
为什么特别喜欢聚合而不是groupByKey?