一个群集节点是否有可能监视自身,并使其在某些条件下消耗掉?就像Dockerfile中的HEALTHCHECK
一样,我想指定确定节点运行状况的脚本。
[编辑]例如,这种情况今天才开始发生:
$ sudo docker run --rm hello-world
docker: Error response from daemon: failed to update the store state of sandbox:
failed to update store for object type *libnetwork.sbState: invalid character 'H'
looking for beginning of value.
我知道如何修复这个特定问题,但是该节点仍然报告Ready
和Active
,并且正在接受无法运行的任务。运行状况检查将能够确定该节点无法运行容器,并禁用该节点。
您还能如何实现自我修复的基础架构?