我有以下要求:
我能够编写一个消耗PCollection的函数,根据我的业务逻辑进行必要的分组,逻辑和过滤并发出事件。
问题:
非常感谢
答案 0 :(得分:1)
PCollection
重新显示到全局窗口中(使用常规Window.into()
)并使用GroupByKey
进行重复数据删除。PCollection
返回。为了对每个事件"做一些事情,您只需要ParDo.of(whatever action you want)
应用于此集合。触发器执行其他操作:它们控制当V
中的特定键K
到达新值GroupByKey<K, V>
时发生的情况:是删除值还是缓冲它,或者通过缓冲KV<K, Iterable<V>>
以进行下游处理。