Mongo副本集`rs.add()`生成初始主要辅助并呈现主要`致命'

时间:2014-09-16 22:56:56

标签: mongodb database-replication

我不能为了我的生活,我无法获得> 1成员副本设置。我得到一个单独的主要开始似乎是正确的:

sb-rs:PRIMARY> rs.status()
{
    "set" : "sb-rs",
    "date" : ISODate("2014-09-16T22:38:53Z"),
    "myState" : 1,
    "members" : [
        {
            "_id" : 0,
            "name" : "primary-hostname:27017",
            "health" : 1,
            "state" : 1,
            "stateStr" : "PRIMARY",
            "uptime" : 1213,
            "optime" : Timestamp(1410904778, 2),
            "optimeDate" : ISODate("2014-09-16T21:59:38Z"),
            "self" : true
        }
    ],
    "ok" : 1
}

然后我开始使用:

  

mongod --config /etc/mongo.conf --replSet sb-rs

子进程成功启动,父进程退出

然后从我做的小学:

sb-rs:PRIMARY> rs.add({_id: 1, host: "secondary-ip:27017", priority: 0, hidden: true})
{ "ok" : 1 }

然后我明白了:

sb-rs:PRIMARY> rs.status()
Tue Sep 16 15:41:30.226 DBClientCursor::init call() failed
Tue Sep 16 15:41:30.228 Error: error doing query: failed at src/mongo/shell/query.js:78
Tue Sep 16 15:41:30.228 trying reconnect to 127.0.0.1:27017
Tue Sep 16 15:41:30.229 reconnect 127.0.0.1:27017 ok
sb-rs:SECONDARY> rs.status()
{
    "set" : "sb-rs",
    "date" : ISODate("2014-09-16T22:41:37Z"),
    "myState" : 4,
    "syncingTo" : "173.255.210.15:27017",
    "members" : [
        {
            "_id" : 0,
            "name" : "primary-hostname:27017",
            "health" : 1,
            "state" : 4,
            "stateStr" : "FATAL",
            "uptime" : 1377,
            "optime" : Timestamp(1410907283, 1),
            "optimeDate" : ISODate("2014-09-16T22:41:23Z"),
            "errmsg" : "rollback error: not willing to roll back more than 30 minutes of data",
            "self" : true
        },
        {
            "_id" : 1,
            "name" : "secondary-ip:27017",
            "health" : 1,
            "state" : 1,
            "stateStr" : "PRIMARY",
            "uptime" : 14,
            "optime" : Timestamp(1410848803, 1),
            "optimeDate" : ISODate("2014-09-16T06:26:43Z"),
            "lastHeartbeat" : ISODate("2014-09-16T22:41:36Z"),
            "lastHeartbeatRecv" : ISODate("1970-01-01T00:00:00Z"),
            "pingMs" : 71
        }
    ],
    "ok" : 1
}

有人可以帮我解决我做错了什么或我可能缺少什么吗?

1 个答案:

答案 0 :(得分:2)

没有太多可以继续,但是您收到rollback错误的事实表明您添加的辅助节点已经在其oplog中包含数据,它似乎已经有了副本集配置,然后它包含的数据将触发回滚。这可能是以前使用的遗留问题,或者只是意外事故,但它似乎认为它已经是集合的成员,而不是加入新集合并按预期进行初始同步。

我建议在将辅助数据库添加到集合之前完全擦除辅助数据库(删除其数据文件)(当然,假设您不需要数据),并且不要指定完整文档({{ 1}},优先级等。)添加它时,只需执行_id即可保持简单。添加后,您可以将其设置为优先级0并隐藏 - 现在指定完整配置文档只是根据可能出错的地方添加另一个变量。

将其添加到集合中时,查看辅助节点上的日志以确保它在加入集合时进行初始同步 - 如果在执行此操作后失败,则最好发布日志以确定是什么继续。