我在AWS EC2实例上使用MongoDB 3.6.3。
MongoDB Server独立运行了几个月(仅一个实例),并收集了约70GB的数据。我用ReplicaSet设置了另一个节点。除了初始同步外,整个设置工作正常。
开始初始同步时,辅助节点进入 STARTUP2 状态。 mongoDB日志显示了如下同步过程:
2018-08-08T23:00:06.039+0200 I - [repl writer worker 3] mydatabase.mycollection collection clone progress: 32671353/180949030 18% (documents copied)
到目前为止,一切都很好。但是突然之间,主要节点和次要节点之间的连接中断。在主节点上,我得到了以下信息:
2018-08-09T04:20:03.616+0000 I NETWORK [thread1] Socket say send() Connection timed out 172.xx.xx.xxx:27017
2018-08-09T04:20:03.618+0000 I NETWORK [thread1] trying reconnect to 172.xx.xx.xxx:27017 (172.xx.xx.xxx) failed
2018-08-09T04:20:03.620+0000 I NETWORK [thread1] reconnect 172.xx.xx.xxx:27017 (172.xx.xx.xxx) ok
在辅助节点上,日志中没有任何内容。断开连接前的最后一个日志是:
2018-08-08T23:00:06.039+0200 I - [repl writer worker 3] mydatabase.mycollection collection clone progress: 32671353/180949030 18% (documents copied)
2018-08-08T23:01:08.710+0200 I ASIO [NetworkInterfaceASIO-RS-0] Connecting to 172.xx.xx.xxx:27017
2018-08-08T23:01:08.714+0200 I ASIO [NetworkInterfaceASIO-RS-0] Successfully connected to 172.xx.xx.xxx:27017, took 4ms (3 connections now open to 172.xx.xx.xxx:27017)
我尝试了几次初始同步,但始终中止。在我看来,每次同步都会在完全相同的点中止(只是一种感觉)。
任何建议如何解决?