3台主机,有2台共享文件系统是活动的,其中1台主机的共享文件系统是不活动的,请问怎么处理然后恢复。求助
(0)
参考下 :
检查存储网络连通性
登录故障主机后台,执行 ping
命令测试与其他节点的存储内外网IP是否通信正常。若网络不通,需排查物理链路、交换机配置或防火墙规则。
确认存储健康状态
执行 ceph -s
和 ceph osd tree
命令,检查Ceph集群是否为 HEALTH_OK
,所有OSD是否处于 up
和 in
状态。若存在OSD异常,需修复存储池或更换故障硬盘。
对比多路径配置文件
检查故障主机的 /etc/multipath.conf
文件,与正常节点对比 blacklist_exceptions
中的wwid是否一致。若缺失存储卷的wwid,需手动添加并重启多路径服务:
service multipath-tools restart
验证O2CB参数一致性
对比 /etc/default/o2cb
文件中的参数(如心跳超时阈值),确保所有节点配置一致。若不一致,修改为正常节点参数后重启服务:
systemctl restart o2cb
查看关键日志
存储日志:检查 /var/log/ocfs2_shell_xxx.log
和 /var/log/fsm/fsm_core.log
,关注以下错误:
数据库表项丢失
,可能是Onestor数据库回滚导致,需联系研发手动修复。o2cb参数不一致
,需同步配置文件并重启服务。多路径日志:检查 /var/log/messages
或 journalctl -u multipathd
,确认多路径服务是否正常识别存储设备。
强制扫描存储适配器
在管理界面进入 主机管理 > 硬件适配器 > Open-iSCSI,选择 强制扫描,刷新存储设备列表。
主机名修改导致异常
若故障主机曾手动修改过主机名(如从 cvknode1
改为 cvknode01
),需恢复原始主机名:
hostnamectl set-hostname <原始主机名>
随后删除并重新添加该主机到集群,确保 /etc/cvk/cluster.conf
和 /etc/ocfs2/cluster.conf
文件一致。
存储池无法激活
若共享文件系统处于非活动状态,尝试在前台手动启动。若仍失败,执行以下操作:
umount /vms/<存储路径>
fsck -fy /dev/mapper/<存储卷ID>
若上述步骤无法解决,需收集以下信息并联系H3C技术支持:
/var/log/ocfs2_shell_xxx.log
、/var/log/fsm/fsm_core.log
和 /var/log/messages
。multipath.conf
、cluster.conf
和 o2cb
配置文件。ceph -s
、ceph osd tree
)。注意:操作前务必备份关键配置文件,避免误操作导致数据丢失。
(0)
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论