根据OneStor分布式存储运维逻辑,在计算节点后台拉起宕机OSD的操作步骤如下(注意:需登录故障OSD所在物理节点执行):
操作命令流程
1. 确认OSD状态与ID
ceph -s | grep osd 查看整体OSD状态
ceph osd tree | grep down 定位宕机OSD的ID(例如osd.12)
2. 进入Ceph容器环境
container exec -it ceph-mon /bin/bash 进入Mon监控容器(容器名可能为ceph-osd/ceph-mon,按实际调整)
3. 尝试拉起宕机OSD
ceph osd safe-to-destroy <osd-id 检查是否允许销毁重建(无业务风险)
ceph osd out <osd-id 强制标记OSD为OUT状态(解除映射)
ceph osd destroy <osd-id --yes-i-really-mean-it 销毁异常OSD进程
ceph osd in <osd-id 重新标记为IN(触发自动拉起)
4. 验证恢复状态
ceph osd stat | grep <osd-id 检查该OSD是否恢复"up"
systemctl restart ceph-osd@<osd-id.service 若未自动恢复,尝试重启服务
注意:
若以上操作无效,需排查底层原因(磁盘故障/网络中断):
dmesg | grep -i error 检查内核磁盘报错
ceph daemon osd.<id
status 查看OSD详细日志
强制操作可能导致数据重平衡,需在业务低峰期执行。
物理磁盘损坏需更换硬件后重新部署OSD。
如仍无法解决,请收集操作结果及ceph health detail输出信息进一步定位。
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论