proxmox集群节点崩溃处理-实操 节点故障 恢复上线

3年前 ( 02-20 ) 2141阅读 0评论
这篇文章最后更新于1128天前,您需要注意相关的内容是否还可用,如有疑问请联系作者!

本次故障缘起 节点的 系统盘挂掉导致集群掉线

微信图片_20200220113659.png

ü  从集群中删除故障ceph


1.       登录集群任意物理正常节点系统,执行如下命令查看ceph osd状态: ceph osd tree

2.       离线有问题的ceph osd,执行的操作如下   ceph osd out osd.X  X 代表 osd数字

3.       删除已经离线osd认证信息,执行的操作如下: ceph auth del osd.X 

4.       彻底删除故障osd,操作如下:ceph osd rm X

5.       查看集群osd状态,操作如下: ceph osd tree

6.       删除故障节点的ceph磁盘,操作如下:  ceph osd crush rm osd.X 

7.       从ceph集群中删除物理节点,操作如下  ceph osd crush rm  pvename  

然后从集群删除故障节点

pvecm  delnode pvename


操作完这些记得 编辑 /etc/pve/ceph.conf  删除故障 监视器配置

等系统重新做好 加入集群即可

QQ截图20200220113431.png

QQ截图20200220114015.png

文章版权声明:除非注明,否则均为海湾博客原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (暂无评论,2141人围观)

还没有评论,来说两句吧...

取消
支付宝二维码
支付宝二维码
微信二维码