Question

我们有一个2个对等的glusterfs集群，每个集群有4个磁盘。每个服务器都有4x10TB磁盘。我们正在使用2个副本（4 x 2 = 8）。由于容量有限，我们添加了具有相同规格的新服务器。现在系统是6 x 2 = 12。

音量信息如下：

Volume Name: gvol1
Type: Distributed-Replicate
Volume ID: 9212f815-a6b6-4fd7-894b-c80628d4d18b
Status: Started
Snapshot Count: 0
Number of Bricks: 6 x 2 = 12
Transport-type: tcp
Bricks:
Brick1: n1:/home/bricks/1/brick
Brick2: n2:/home/bricks/1/brick
Brick3: n1:/home/bricks/2/brick
Brick4: n2:/home/bricks/2/brick
Brick5: n1:/home/bricks/3/brick
Brick6: n2:/home/bricks/3/brick
Brick7: n1:/home/bricks/4/brick
Brick8: n2:/home/bricks/4/brick
Brick9: n3:/home/bricks/1/brick
Brick10: n3:/home/bricks/2/brick
Brick11: n3:/home/bricks/3/brick
Brick12: n3:/home/bricks/4/brick
Options Reconfigured:
network.ping-timeout: 5
performance.client-io-threads: off
nfs.disable: on
storage.fips-mode-rchecksum: on
transport.address-family: inet

添加新积木后，我们开始了重新平衡操作。重新平衡之前，我们还使用以下命令检查了系统的运行状况：

gluster音量恢复gvol1状态

一切似乎都很好，因此我们开始了重新平衡过程。重新平衡仍在进行中，但是对等方之一在启动1分钟后失败。我们已经检查了重新平衡日志，并且似乎在开始重新平衡时出现了暂时的网络错误。

现在重新平衡状态如下：

Node Rebalanced-files          size       scanned      failures       skipped               status  run time in h:m:s
---------      -----------   -----------   -----------   -----------   -----------         ------------     --------------
n2            50134         3.7TB        127701             0          1857          in progress       27:43:02
n3                0        0Bytes             0             0             0            completed        0:08:50
localhost         0        0Bytes             0             1             0               failed        0:00:00
Estimated time left for rebalance to complete :       69:51:32
volume rebalance: gvol1: success

现在，我想重新启动对等方1的余额处理。

是否可以在不停止当前进程的情况下仅重新启动server1？

该卷已启用并正在使用。

谢谢。

Glusterfs重新平衡失败的同级而不停止重新平衡

0 个答案: