我们有一个12节点的cassandra集群,分布在2个数据中心中,每个数据中心中有6个节点。尝试登录cqlsh时,对于大多数节点,它给出以下错误,并且仅允许登录一个节点:
Connection error: ('Unable to connect to any servers', {'<server_IP>': OperationTimedOut('errors=Timed out creating connection (5 seconds), last_host=None',)})
我看到的唯一区别是它正在工作的节点没有阻止对Native-Transport-Requests的请求。这可能是问题吗?这是不工作的节点之一的tpstats输出。
我们还运行了2个网络应用程序,一个从cassandra读取数据,另一个向其中写入数据。我们还看到该.net应用程序经常因 Cassandra No host exception 而关闭。是因为同样的原因吗?
答案 0 :(得分:1)
升级cassandra集群后,我遇到了同样的错误。我看到@Parth Gandhi的帖子中有关被阻止的本地传输的问题,并意识到我们已经将native_transport_max_threads设置为零,以为它将设置为无限制。关于它的日志中实际上没有任何错误,因此非常奇怪。一旦我从cassandra.yaml中注释掉了native_transport_max_threads的参数并反弹了该节点,我终于可以再次连接到集群。