proxmox集群节点崩溃处理-实操 节点故障 恢复上线

4年前 ( 02-20 ) 2881阅读 0评论
这篇文章最后更新于1499天前,您需要注意相关的内容是否还可用,如有疑问请联系作者!

本次故障缘起 节点的 系统盘挂掉导致集群掉线

微信图片_20200220113659.png

ü  从集群中删除故障ceph


1.       登录集群任意物理正常节点系统,执行如下命令查看ceph osd状态: ceph osd tree

2.       离线有问题的ceph osd,执行的操作如下   ceph osd out osd.X  X 代表 osd数字

3.       删除已经离线osd认证信息,执行的操作如下: ceph auth del osd.X 

4.       彻底删除故障osd,操作如下:ceph osd rm X

5.       查看集群osd状态,操作如下: ceph osd tree

6.       删除故障节点的ceph磁盘,操作如下:  ceph osd crush rm osd.X 

7.       从ceph集群中删除物理节点,操作如下  ceph osd crush rm  pvename  

然后从集群删除故障节点

pvecm  delnode pvename


操作完这些记得 编辑 /etc/pve/ceph.conf  删除故障 监视器配置

等系统重新做好 加入集群即可

QQ截图20200220113431.png

QQ截图20200220114015.png

文章版权声明:除非注明,否则均为IT技术交流分享 IDC管理计费系统 私有云管理系统 PVE管理系统 私有云系统原创文章,转载或复制请以超链接形式并注明出处。
取消
支付宝二维码
支付宝二维码
微信二维码