Windows 2008上具有多个管理节点的MySQL Cluster 7.1

时间:2010-05-21 13:12:58

标签: mysql cluster-computing

我希望有人能指出我在使用带有多个管理节点的MySQL Cluster 7.1集群3台服务器时出错的地方。

目前,群集与一个管理节点完美配合。这是设置:

  1. 第一台服务器仅运行ndb_mgmd(192.168.66.114)
  2. 的实例
  3. 第二台服务器运行ndbd和mysqld(192.168.66.2)
  4. 的实例
  5. 第三台服务器运行ndbd和mysqld(192.168.66.113)
  6. 的实例

    我想在集群中引入第二个管理节点。我对两个管理服务器都有完全相同的config.ini。这是:

    [NDBD DEFAULT]
    NoOfReplicas=2
    
    [MYSQLD DEFAULT]
    
    [NDB_MGMD DEFAULT]
    PortNumber=1186
    datadir=c:/Progra~1/mysql-cluster-gpl-7.1.3-win32
    LogDestination=FILE:filename=c:/Progra~1/mysql-cluster-gpl-7.1.3-win32/clusterlog.log
    
    
    [TCP DEFAULT]
    
    # Management Server
    [NDB_MGMD]
    Id=1
    HostName=192.168.66.114
    ArbitrationRank=1
    
    [NDB_MGMD]
    Id=6
    HostName=192.168.66.2
    ArbitrationRank=2
    
    # Storage Engines
    [NDBD]
    Id=2
    HostName=192.168.66.2
    DataDir= D:/AppData/ndb-7.1.3
    
    [NDBD]
    Id=3
    HostName=192.168.66.113
    DataDir= D:/AppData/ndb-7.1.3
    
    [MYSQLD]
    Id=4
    HostName=192.168.66.2
    
    [MYSQLD]
    Id=5
    HostName=192.168.66.113
    

    当我在两台服务器上启动ndb_mgmd实例并在show中发出ndb_mgm命令时,在第一个管理服务器上,我看到它已启动:

    ndb_mgm> show
    Connected to Management Server at: localhost:1186
    Cluster Configuration
    ---------------------
    [ndbd(NDB)]     2 node(s)
    id=2    @192.168.66.2  (mysql-5.1.44 ndb-7.1.3, Nodegroup: 0, Master)
    id=3    @192.168.66.113  (mysql-5.1.44 ndb-7.1.3, Nodegroup: 0)
    
    [ndb_mgmd(MGM)] 2 node(s)
    id=1    @192.168.66.114  (mysql-5.1.44 ndb-7.1.3)
    id=6 (not connected, accepting connect from 192.168.66.2)
    
    [mysqld(API)]   2 node(s)
    id=4    @192.168.66.2  (mysql-5.1.44 ndb-7.1.3)
    id=5    @192.168.66.113  (mysql-5.1.44 ndb-7.1.3)
    
    ndb_mgm>
    

    我还没有在第二个管理服务器上启动第二个管理实例,所以以下几行完全正常(从ndb_mgm输出上面):

    id=6 (not connected, accepting connect from 192.168.66.2)
    

    然后,我转到第二个管理服务器(192.168.66.2),然后启动ndb_mgmd。启动后,我发出一个show命令:

    ndb_mgm> show
    Cluster Configuration
    ---------------------
    [ndbd(NDB)]     2 node(s)
    id=2 (not connected, accepting connect from 192.168.66.2)
    id=3 (not connected, accepting connect from 192.168.66.113)
    
    [ndb_mgmd(MGM)] 2 node(s)
    id=1 (not connected, accepting connect from 192.168.66.114)
    id=6    @192.168.66.2  (mysql-5.1.44 ndb-7.1.3)
    
    [mysqld(API)]   2 node(s)
    id=4 (not connected, accepting connect from 192.168.66.2)
    id=5 (not connected, accepting connect from 192.168.66.113)
    
    ndb_mgm>
    

    第二个管理节点只报告它本身已连接,而不是将两个管理节点都列为已连接。返回第一个管理服务器192.168.66.114仍然提供与启动第二个ndb_mgmd之前相同的输出,即仅连接192.168.66.114的管理节点:

    ndb_mgm> show
    Connected to Management Server at: localhost:1186
    Cluster Configuration
    ---------------------
    [ndbd(NDB)]     2 node(s)
    id=2    @192.168.66.2  (mysql-5.1.44 ndb-7.1.3, Nodegroup: 0, Master)
    id=3    @192.168.66.113  (mysql-5.1.44 ndb-7.1.3, Nodegroup: 0)
    
    [ndb_mgmd(MGM)] 2 node(s)
    id=1    @192.168.66.114  (mysql-5.1.44 ndb-7.1.3)
    id=6 (not connected, accepting connect from 192.168.66.2)
    
    [mysqld(API)]   2 node(s)
    id=4    @192.168.66.2  (mysql-5.1.44 ndb-7.1.3)
    id=5    @192.168.66.113  (mysql-5.1.44 ndb-7.1.3)
    
    ndb_mgm>
    

    我花了很多时间试图弄清楚什么是错的,但无济于事。另请查看第一个管理服务器的ndb_mgmd日志文件,摘录在192.168.66.2开始第二个ndb_mgmd后立即执行:

    2010-05-21 16:05:04 [MgmtSrvr] INFO     -- Reading cluster configuration from 'c:/Progra~1/mysql-cluster-gpl-7.1.3-win32/config.ini'
    2010-05-21 16:05:04 [MgmtSrvr] WARNING  -- at line 45: Cluster configuration warning:
      arbitrator with id 6 and db node with id 2 on same host 192.168.66.2
      Running arbitrator on the same host as a database node may
      cause complete cluster shutdown in case of host failure.
    2010-05-21 16:05:04 [MgmtSrvr] INFO     -- Config equal!
    2010-05-21 16:05:04 [MgmtSrvr] INFO     -- Mgmt server state: nodeid 1 reserved for ip 192.168.66.114, m_reserved_nodes 1.
    2010-05-21 16:05:04 [MgmtSrvr] INFO     -- Id: 1, Command port: *:1186
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- 127.0.0.1:3727: Connected!
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- Sending CONFIG_CHECK_REQ to 1
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- Got CONFIG_CHECK_REQ from node: 1. Our generation: 1, other generation: 1, our state: 2, other state: 2, our checksum: 0xc7202738, other checksum: 0xc7202738
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- Send CONFIG_CHECK_CONF to node: 1
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- Got CONFIG_CHECK_CONF from node: 1
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- 192.168.66.113:51051: Connected!
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- 192.168.66.2:65492: Connected!
    2010-05-21 16:05:04 [MgmtSrvr] INFO     -- Node 1: Node 6 Connected
    2010-05-21 16:05:04 [MgmtSrvr] INFO     -- Node 6 connected
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- Sending CONFIG_CHECK_REQ to 6
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- Got CONFIG_CHECK_CONF from node: 6
    2010-05-21 16:05:04 [MgmtSrvr] INFO     -- Node 1: Node 3 Connected
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- 192.168.66.113:51051: Stopped!
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- 192.168.66.113:51051: Disconnected!
    2010-05-21 16:05:04 [MgmtSrvr] INFO     -- Node 1: Node 2 Connected
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- 192.168.66.2:65492: Stopped!
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- 192.168.66.2:65492: Disconnected!
    2010-05-21 16:05:05 [MgmtSrvr] INFO     -- Node 3: Prepare arbitrator node 1 [ticket=16800008ebadb656]
    2010-05-21 16:05:05 [MgmtSrvr] INFO     -- Node 2: Started arbitrator node 1 [ticket=16800008ebadb656]
    

    就个人而言,我发现上述输出中的以下两行很有意思:

    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- 192.168.66.2:65492: Stopped!
    2010-05-21 16:05:04 [MgmtSrvr] DEBUG    -- 192.168.66.2:65492: Disconnected!
    

    但是没有错误消息,只是说停止和断开。

    有人能弄明白我的设置有什么问题吗?任何帮助都会非常感激。

2 个答案:

答案 0 :(得分:1)

http://dev.mysql.com/tech-resources/articles/mysql-cluster-for-two-servers.html

以上链接是我用于实现群集设置的分步指南。本文适用于基于Linux的设置,但Windows安装的步骤几乎完全相同。 Windows的命令行语法当然不同。您需要处理的唯一区别是将MySQL群集文件放在Windows框中的适当位置并手动安装服务。完成后,没有区别 - 所有这些都在配置文件中完成。 对于初学者,您可以复制安装文件,然后从命令行启动所有内容。通过这种方式,您可以轻松解决可能出现的任何问题,因为您将在命令提示符窗口中看到错误。否则,您需要先查看日志来配置日志记录,以了解发生的最新情况。请注意,你必须成为魔术师才能在第一次尝试时完成所有工作,因此请将日志记录留给初学者,并在命令提示符窗口中直接查看集群服务的输出。 如果你设法使一切正常,你应该继续在Windows下安装“守护进程”作为服务。如果需要帮助,我可以帮助你。原来安装服务可能是一个非常棘手的任务 - 虽然它已经安装了我的集群,我记得安装服务花了我一些时间。我是在试错的基础上做到的。从内存中,您应该在安装服务时在路径中使用仅8.3名称。否则我的启动失败(或作为服务安装,不记得确切)。

答案 1 :(得分:0)

伙计们,这个人实际上已经解决了。不知道为什么,但是今天晚些时候第二个管理节点在没有我干预的情况下开始正常连接。