
3台主机,有2台共享文件系统是活动的,其中1台主机的共享文件系统是不活动的,请问怎么处理然后恢复。求助



(0)
参考下 :
检查存储网络连通性
登录故障主机后台,执行 ping 命令测试与其他节点的存储内外网IP是否通信正常。若网络不通,需排查物理链路、交换机配置或防火墙规则。
确认存储健康状态
执行 ceph -s 和 ceph osd tree 命令,检查Ceph集群是否为 HEALTH_OK,所有OSD是否处于 up 和 in 状态。若存在OSD异常,需修复存储池或更换故障硬盘。
对比多路径配置文件
检查故障主机的 /etc/multipath.conf 文件,与正常节点对比 blacklist_exceptions 中的wwid是否一致。若缺失存储卷的wwid,需手动添加并重启多路径服务:
service multipath-tools restart
验证O2CB参数一致性
对比 /etc/default/o2cb 文件中的参数(如心跳超时阈值),确保所有节点配置一致。若不一致,修改为正常节点参数后重启服务:
systemctl restart o2cb
查看关键日志
存储日志:检查 /var/log/ocfs2_shell_xxx.log 和 /var/log/fsm/fsm_core.log,关注以下错误:
数据库表项丢失,可能是Onestor数据库回滚导致,需联系研发手动修复。o2cb参数不一致,需同步配置文件并重启服务。多路径日志:检查 /var/log/messages 或 journalctl -u multipathd,确认多路径服务是否正常识别存储设备。
强制扫描存储适配器
在管理界面进入 主机管理 > 硬件适配器 > Open-iSCSI,选择 强制扫描,刷新存储设备列表。
主机名修改导致异常
若故障主机曾手动修改过主机名(如从 cvknode1 改为 cvknode01),需恢复原始主机名:
hostnamectl set-hostname <原始主机名>
随后删除并重新添加该主机到集群,确保 /etc/cvk/cluster.conf 和 /etc/ocfs2/cluster.conf 文件一致。
存储池无法激活
若共享文件系统处于非活动状态,尝试在前台手动启动。若仍失败,执行以下操作:
umount /vms/<存储路径>fsck -fy /dev/mapper/<存储卷ID>若上述步骤无法解决,需收集以下信息并联系H3C技术支持:
/var/log/ocfs2_shell_xxx.log、/var/log/fsm/fsm_core.log 和 /var/log/messages。multipath.conf、cluster.conf 和 o2cb 配置文件。ceph -s、ceph osd tree)。注意:操作前务必备份关键配置文件,避免误操作导致数据丢失。
(0)
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论