出于优化目的,我试图更好地了解Kafka流中每个操作的成本,例如内部主题已创建,状态存储的使用以及其他内容。
到目前为止,我唯一感到困惑的是联接。我想更好地了解所涉及的内容以及大致情况。
例如,对于聚合,我理解重新分区主题+状态存储的使用以及changelog主题,因为它以KTable结尾?
但是我不确定加入。我认为涉及重新分区内部主题,最后还涉及changelog主题,但是我不确定如何针对状态存储执行联接。是否有一个州立商店或两个州立商店?如何通过状态存储执行联接?
请注意,我特别对KTable-KTable Join或Aggregation感兴趣。如果某个地方有一些技术文档,我很乐意帮助他们。