Consul集群并没有开始

时间:2017-11-29 08:35:09

标签: consul

我有Consul集群的AWS启动配置。到目前为止它运行没有问题,但现在它没有工作。查询任何节点会导致"没有领导者选出"。

所以我通过SSH进入实例。 consul info会产生Error querying agent: Get http://127.0.0.1:8500/v1/agent/self: dial tcp 127.0.0.1:8500: getsockopt: connection refused

接下来我尝试了: $ ps -ef | grep consul consul 2760 1 0 Nov28 ? 00:01:38 /usr/local/bin/consul agent -server -config-file=/etc/consul.conf -data-dir=/tmp/consul -node=1.1.1.1_i-042b3e8f28c622a -bind=2.2.2.2 -config-dir=/etc/consul.d (我在这里隐藏了IP和实例ID)

查看我看到的日志:

==> WARNING: Expect Mode enabled, expecting 3 servers
==> Starting Consul agent...
==> Consul agent running!
           Version: 'v0.8.3'
           Node ID: '6e0b3c-ad49-90d7-c8e2-121144a4ba'
         Node name: '1.1.1.1_i-029b3e8f28622a'
        Datacenter: 'dc1'
            Server: true (bootstrap: false)
       Client Addr: 127.0.0.1 (HTTP: 8500, HTTPS: -1, DNS: 8600)
      Cluster Addr: 2.2.2.2 (LAN: 8301, WAN: 8302)
    Gossip encrypt: false, RPC-TLS: false, TLS-Incoming: false
             Atlas: <disabled>

==> Log data will now stream in as it occurs:

    2017/11/28 13:19:36 [INFO] raft: Initial configuration (index=0): []
    2017/11/28 13:19:36 [INFO] serf: EventMemberJoin: 1.1.1.1_i-029b3e8f28c46622a 2.2.2.2
    2017/11/28 13:19:36 [INFO] serf: EventMemberJoin: 1.1.1.1_i-029b3e8f28c46622a.dc1 2.2.2.2
    2017/11/28 13:19:36 [INFO] raft: Node at 2.2.2.2:8300 [Follower] entering Follower state (Leader: "")
    2017/11/28 13:19:36 [INFO] consul: Adding LAN server 1.1.1.1_i-029b3e8f28c46622a (Addr: tcp/2.2.2.2:8300) (DC: dc1)
    2017/11/28 13:19:36 [INFO] consul: Handled member-join event for server "1.1.1.1_i-029b3e8f28c22a.dc1" in area "wan"
    2017/11/28 13:19:36 [INFO] agent: Joining cluster...
    2017/11/28 13:19:36 [INFO] agent: No EC2 region provided, querying instance metadata endpoint...
    2017/11/28 13:19:36 [INFO] agent: Discovered 0 servers from EC2
    2017/11/28 13:19:36 [WARN] agent: Join failed: No servers to join, retrying in 30s
    2017/11/28 13:19:43 [ERR] agent: failed to sync remote state: No cluster leader

有关如何解决此问题的任何想法?

3 个答案:

答案 0 :(得分:4)

您应该引导群集以允许初始领导者选举,最简单的方法是将-bootstrap-expect与群集中的服务器数量一起使用(对所有服务器使用相同的标志和值)。

有关引导群集的更多信息 - https://www.consul.io/docs/guides/bootstrapping.html

https://www.consul.io/docs/agent/options.html#_bootstrap

在你的情况下,它说&#34;警告:期望模式启用,期望3台服务器&#34;所以在引导集群之前它需要3台服务器。我看到你只用了两个?加入另一个,它应该工作......(对于共识系统,建议不要超过3个。)

答案 1 :(得分:0)

有一种更好的方法,可以使用-bootstrap指定服务器节点。这样就无需启动3台服务器来启动领事群集选择领导者。

答案 2 :(得分:0)

Ubuntu-+ AWS的详细说明:

  1. 您的文件应如下所示:/etc/consul/base.json

A

(retry_join-如果使用的是ec2标记,则为可选),请确保您已将IAM角色附加到实例)

  1. 服务领事重启

  2. 运行-#consul操作员筏列表对等 您应该会看到领导者,否则请查看/ var / log / syslog以获得更多详细信息以进行故障排除