proxmox集群节点崩溃处理-实操 节点故障 恢复上线

本文由 海湾 于 2020-2-20 0:05 Thursday 发布在 PVE 评论(0)

本次故障缘起 节点的 系统盘挂掉导致集群掉线

微信图片_20200220113659.png

ü  从集群中删除故障ceph


1.       登录集群任意物理正常节点系统,执行如下命令查看ceph osd状态: ceph osd tree

2.       离线有问题的ceph osd,执行的操作如下   ceph osd out osd.X  X 代表 osd数字

3.       删除已经离线osd认证信息,执行的操作如下: ceph auth del osd.X 

4.       彻底删除故障osd,操作如下:ceph osd rm X

5.       查看集群osd状态,操作如下: ceph osd tree

6.       删除故障节点的ceph磁盘,操作如下:  ceph osd crush rm osd.X 

7.       从ceph集群中删除物理节点,操作如下  ceph osd crush rm  pvename  

然后从集群删除故障节点

pvecm  delnode pvename


操作完这些记得 编辑 /etc/pve/ceph.conf  删除故障 监视器配置

等系统重新做好 加入集群即可

QQ截图20200220113431.png

QQ截图20200220114015.png

标签: promox 删除无效节点然后恢复

关于本站  |  海湾博客  |  手机版  |  空间支持  |  RSS信息  |  QQ交流  |  

All Rights Reserved. Powered by Emlog & Themes by boydata.com  
回到顶部