标签: apache-flink
我们要收集用于流处理的指标,通常记录1分钟时段内汇总的计数。但是,我们希望这些1分钟的边界由数据记录中的时间戳确定。 Flink度量标准无法解决此问题,因此我们希望自己推出。如何进行 ?我们的一些团队成员认为,我们可以在可从主Flink程序调用的操作员类代码中添加方法,虽然我不确定这是否可行。其他人则考虑使用带有每个输入记录一条记录的侧面输出流,并使用现有的Flink运算符进行聚合。但这可能会使处理的记录数量增加一倍。
我们可以扩展Flink指标以提供这种聚合吗?