Glusterfs重新平衡失败的同级而不停止重新平衡

时间:2020-10-22 10:37:09

标签: glusterfs

我们有一个2个对等的glusterfs集群,每个集群有4个磁盘。每个服务器都有4x10TB磁盘。我们正在使用2个副本(4 x 2 = 8)。由于容量有限,我们添加了具有相同规格的新服务器。现在系统是6 x 2 = 12。

音量信息如下:

Volume Name: gvol1
Type: Distributed-Replicate
Volume ID: 9212f815-a6b6-4fd7-894b-c80628d4d18b
Status: Started
Snapshot Count: 0
Number of Bricks: 6 x 2 = 12
Transport-type: tcp
Bricks:
Brick1: n1:/home/bricks/1/brick
Brick2: n2:/home/bricks/1/brick
Brick3: n1:/home/bricks/2/brick
Brick4: n2:/home/bricks/2/brick
Brick5: n1:/home/bricks/3/brick
Brick6: n2:/home/bricks/3/brick
Brick7: n1:/home/bricks/4/brick
Brick8: n2:/home/bricks/4/brick
Brick9: n3:/home/bricks/1/brick
Brick10: n3:/home/bricks/2/brick
Brick11: n3:/home/bricks/3/brick
Brick12: n3:/home/bricks/4/brick
Options Reconfigured:
network.ping-timeout: 5
performance.client-io-threads: off
nfs.disable: on
storage.fips-mode-rchecksum: on
transport.address-family: inet

添加新积木后,我们开始了重新平衡操作。重新平衡之前,我们还使用以下命令检查了系统的运行状况:

gluster音量恢复gvol1状态

一切似乎都很好,因此我们开始了重新平衡过程。重新平衡仍在进行中,但是对等方之一在启动1分钟后失败。我们已经检查了重新平衡日志,并且似乎在开始重新平衡时出现了暂时的网络错误。

现在重新平衡状态如下:

Node Rebalanced-files          size       scanned      failures       skipped               status  run time in h:m:s
---------      -----------   -----------   -----------   -----------   -----------         ------------     --------------
n2            50134         3.7TB        127701             0          1857          in progress       27:43:02
n3                0        0Bytes             0             0             0            completed        0:08:50
localhost         0        0Bytes             0             1             0               failed        0:00:00
Estimated time left for rebalance to complete :       69:51:32
volume rebalance: gvol1: success

现在,我想重新启动对等方1的余额处理。

是否可以在不停止当前进程的情况下仅重新启动server1?

该卷已启用并正在使用。

谢谢。

0 个答案:

没有答案