在负载测试后的一个测试环境中,我的场景中我们的kafka分区的偏移量分布不均匀。如果它偏离了几百个,我认为这很正常,但这似乎有所不同。
在10个分区中,我看到以下分区分布情况:
-------------------------
|partition | offset|
-------------------------
|0 | 100000+|
-------------------------
|1 | ~200|
-------------------------
|2 - 10 | ~50|
-------------------------
...
负载测试生成唯一键,并将它们分配给所生成的事件。根据kafka文档,只要密钥不相同,就应该随机选择一个分区。在我看来,第一个分区的偏移量是如此之高,并想知道是否有人知道为什么会发生这种情况?
在正常情况下,似乎只有在执行负载测试时,这种情况才会发生。
[编辑]:仅生产者配置与SSL设置相关。其他所有内容均为默认设置。 key
是在负载测试期间使用uuid/v4
生成的。
{
host: process.env.KAFKA_URL,
requestTimeout: 1000,
ssl: true,
sslOptions: config.sslOptions
}
答案 0 :(得分:2)
根据kafka文档,只要键不相同,就应该随机选择一个分区。
DefaultPartitioner
类的逻辑更像是
hash(key) % numberOfPartitions
写成code。
看来您的密钥大多落在分区0
上,可能值得重新考虑密钥的创建和/或选择其他分区策略。
如果您确实希望循环选择分区,可以使用null
键。
答案 1 :(得分:0)
使用键选择分区有两个依赖项:
也-> https://www.learningjournal.guru/courses/kafka/kafka-foundation-training/custom-partitioner/