我们有一个2个对等的glusterfs集群,每个集群有4个磁盘。每个服务器都有4x10TB磁盘。我们正在使用2个副本(4 x 2 = 8)。由于容量有限,我们添加了具有相同规格的新服务器。现在系统是6 x 2 = 12。
音量信息如下:
Volume Name: gvol1
Type: Distributed-Replicate
Volume ID: 9212f815-a6b6-4fd7-894b-c80628d4d18b
Status: Started
Snapshot Count: 0
Number of Bricks: 6 x 2 = 12
Transport-type: tcp
Bricks:
Brick1: n1:/home/bricks/1/brick
Brick2: n2:/home/bricks/1/brick
Brick3: n1:/home/bricks/2/brick
Brick4: n2:/home/bricks/2/brick
Brick5: n1:/home/bricks/3/brick
Brick6: n2:/home/bricks/3/brick
Brick7: n1:/home/bricks/4/brick
Brick8: n2:/home/bricks/4/brick
Brick9: n3:/home/bricks/1/brick
Brick10: n3:/home/bricks/2/brick
Brick11: n3:/home/bricks/3/brick
Brick12: n3:/home/bricks/4/brick
Options Reconfigured:
network.ping-timeout: 5
performance.client-io-threads: off
nfs.disable: on
storage.fips-mode-rchecksum: on
transport.address-family: inet
添加新积木后,我们开始了重新平衡操作。重新平衡之前,我们还使用以下命令检查了系统的运行状况:
gluster音量恢复gvol1状态
一切似乎都很好,因此我们开始了重新平衡过程。重新平衡仍在进行中,但是对等方之一在启动1分钟后失败。我们已经检查了重新平衡日志,并且似乎在开始重新平衡时出现了暂时的网络错误。
现在重新平衡状态如下:
Node Rebalanced-files size scanned failures skipped status run time in h:m:s
--------- ----------- ----------- ----------- ----------- ----------- ------------ --------------
n2 50134 3.7TB 127701 0 1857 in progress 27:43:02
n3 0 0Bytes 0 0 0 completed 0:08:50
localhost 0 0Bytes 0 1 0 failed 0:00:00
Estimated time left for rebalance to complete : 69:51:32
volume rebalance: gvol1: success
现在,我想重新启动对等方1的余额处理。
是否可以在不停止当前进程的情况下仅重新启动server1?
该卷已启用并正在使用。
谢谢。