我在 AWS 上有一个 3节点 Kafka集群。为确保Kafka集群正常运行,我添加了一个监视脚本,该脚本定期轮询可用的Kafka节点的数量(这是使用称为{{1}的 Zookeeper CLI 命令完成的,返回的ID数为计数)并将其报告给 AWS Cloudwatch 。
我希望,如果群集正常,则此数字将始终等于群集大小,并且几乎总是这样。 但是每天短时间内(5-15分钟), Zookeeper CLI 命令返回少于3个节点,有时返回1个,有时返回2个,不久后返回到正常大小3节点。
我正在尝试确定这是否是正常行为,也许发生了某些改版或其他内部过程,并且由于某种原因重新注册了节点。 还是我的Kafka集群遇到某种问题?