我有一个Kafka Streams应用程序,它从少数主题中获取数据并加入数据并将其放入另一个主题。
Kafka配置:
5 kafka brokers
Kafka Topics - 15 partitions and 3 replication factor.
每小时消耗/生产的记录数量达数百万。
我正在制作KStream-KStream连接,它创建了2个内部主题。 而KStream-KTable连接将创建1个内部主题+ 1个表。
在性能和其他因素方面哪个更好?
答案 0 :(得分:1)
选择不是性能问题,而是语义的问题:加入结果应该是什么?两个连接都会计算完全不同的结果,因此您应该选择满足应用程序需求的语义。
CP文档和AK wiki中记录了不同的语义: