我正在寻找Kafka Broker的JMX指标[如果可能,则不超过1或2],该指标可以从总体上确定集群的运行状况?我已经提到了由datadog和confluent编制的列表,但是找不到类似的东西。
答案 0 :(得分:2)
我认为指示群集运行状况的某些事情如下:
脱机/复制分区下:这很好地指示了群集中的所有节点是否都处于联机状态。如果其中一个脱机,则几乎可以肯定会看到某些复制不足的情况;如果其中几个脱机,则甚至可能会看到一些脱机的分区。
活动控制器:如果这种情况不断变化,则意味着群集可能不稳定。控制器不应定期更换;如果是这样,则说明您的集群出了点问题。
字节输入/输出:这些表明您的群集能够发送和接收数据。如果这些数量低于您的预期,则可能意味着群集正在发生某种网络问题,这可能会影响群集的运行状况。
希望这会有所帮助!