使用来自不同管道的数据

时间:2017-08-09 08:28:54

标签: google-cloud-dataflow google-cloud-pubsub

我有两个管道," gameEngineEvents"和" userEvents"使用等效的pubsub主题。 userEvent可能有一个或多个gameEngineEvents。

当gameEngineEvent发生时,我想检查是否有一个userEvent具有对该gameEngineEvent的引用,运行一些逻辑,然后将新消息发布到第三个pubsub主题。

那么,是否可以仅在数据流中执行此类操作?

1 个答案:

答案 0 :(得分:0)

这当然是可能的。你想要在这里使用的是CoGroupByKey,它将使用某个键将" gameEngineEvent" s与#34; userEvent"使用该键以便将它们一起处理,对它们执行某种逻辑。您将最终获得该密钥的2个迭代,您可以在处理中使用它。

有关CoGroupByKey具体细节的更多信息,请here

由于这些是PubSub主题,并且您可能正在处理无限制的来源,因此您可能还希望查看Windowing,以便设置要对其执行处理的事件的边界。