标签: apache-flink flink-streaming
我们有Flink作业,使用了来自Kafka的数据,并将其吸收到多站点复制的Cassandra中。
现在,我们必须每小时汇总一次数据。 问题是设备X可以在站点A上报告一次,而在站点B上报告一次。这意味着该设备的某些消息将由站点A中的Flink处理,而某些消息将在站点B上处理。
我想要一个聚合结果,以反映特定设备X传输的所有消息。
是否有最佳实践来处理多站点摄取?任何想法如何处理上述情况? 预先感谢。