我们的一个集群面临以下问题。这个问题断断续续地出现。我们有HDP 2.6.1版本(kafka 0.10.1.0)
但是,当我们重新启动Kafka时,问题消失了,以后又间歇出现。
注意:我们尚未升级集群。这是一个全新的安装。
我们还查看了网络状态,但是并没有显示任何滞后/波动。
[2018-07-02 19:08:38,672] WARN [ReplicaFetcherThread-0-1003], Error in fetch kafka.server.ReplicaFetcherThread$FetchRequest@64cc68c3 (kafka.server.ReplicaFetcherThread)
java.io.IOException: Connection to XXXX:6667 (id: 1003 rack: null) failed at
kafka.utils.NetworkClientBlockingOps$.awaitReady$1(NetworkClientBlockingOps.scala:83) at
kafka.utils.NetworkClientBlockingOps$.blockingReady$extension(NetworkClientBlockingOps.scala:93) at
kafka.server.ReplicaFetcherThread.sendRequest(ReplicaFetcherThread.scala:248) at
kafka.server.ReplicaFetcherThread.fetch(ReplicaFetcherThread.scala:238) at
kafka.server.ReplicaFetcherThread.fetch(ReplicaFetcherThread.scala:42) at
kafka.server.AbstractFetcherThread.processFetchRequest(AbstractFetcherThread.scala:118) at
kafka.server.AbstractFetcherThread.doWork(AbstractFetcherThread.scala:103) at
kafka.utils.ShutdownableThread.run(ShutdownableThread.scala:63).
请提出建议