为什么在ceph osd震荡期间调用boto3列表存储桶操作返回Bad Gateway(502)?

时间:2019-05-28 20:05:32

标签: python amazon-s3 boto3 ceph

与python lib boto3相比,这可能与Ceph集群更相关。当OSD中断时,所有群集响应502(错误网关)到我们的s3客户端(boto3,s3cmd,rclone,aws-cli)。

我的集群的概况: -3个带有Nginx的Rados网关,对civetweb执行fastcgi_pass。 在同一台服务器上正在运行ceph-monitor。 -5台OSD服务器,每台3台OSD。

一切正常,直到一个OSD出现故障。群集立即进入警告状态,并开始将PG重新映射到其他OSD(我将副本3用于池数据)。 但是,当群集恢复时,即使我试图列出存储桶,它也会对所有s3客户端做出502响应。

Values
self.resource = boto3.setup_default_session(**credentials)

for bucket in self.resource.buckets.all():
    yield bucket

我希望Ceph可以处理OSD,因为每个对象仍然有2个副本,但是它却掉了下来。

你们对这里发生的事情有任何想法吗?

0 个答案:

没有答案