• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

cas主机无法访问共享存储

  • 0关注
  • 0收藏,54浏览
粉丝:0人 关注:0人

问题描述:

有问题的cvknode1

 

 

正常的cvknode2

 

cvknode1 启动存储提示

 

3 个回答
已采纳
粉丝:7人 关注:0人

核心错误解析

❗ 错误提示:“OCFS2 residual heartbeat region”

这是 OCFS2 集群文件系统 的典型故障 —— 表示某个节点(这里是 cvknode1)在之前崩溃或非正常退出时,没有 cleanly unmount 共享存储,导致其“心跳区域”(heartbeat region)仍被标记为“存活”,其他节点认为它还在占用资源,从而拒绝挂载。
简单说:cvknode1 “假死”了,集群以为它还活着,不让别人动它的锁。


解决方案(分步骤操作)

 重要前提
  • 确保 cvknode1 当前没有虚拟机正在运行(如有,请先迁移或关机)
  • 确保 cvknode2 或其他节点已正确挂载该 OCFS2 存储
  • 操作前建议备份元数据(可选但推荐)

 步骤一:登录 cvknode1,确认 OCFS2 挂载状态

1# 查看是否已挂载 2df -h | grep cas 3 4# 查看 OCFS2 集群状态 5cat /proc/fs/ocfs2/nodemask 6 7# 查看集群成员 8o2cb_ctl -s
如果看到类似:
1Node Mask: 0x00000003 # 表示有两个节点在线 2Cluster Name: cas_cluster
而 cvknode1 的 node ID 可能还残留着旧的心跳记录。

 

步骤二:强制清除残留心跳(关键!)

方法 A:使用 o2cb_online 和 o2cb_offline 重置节点状态

1# 停止 ocfs2 相关服务 2service o2cb stop 3service ocfs2 stop 4 5# 清除本地心跳缓存(谨慎!仅在本机操作) 6rm -f /dev/shm/heartbeat_* 7 8# 重启 o2cb 服务 9service o2cb start 10service ocfs2 start
 注意:不要直接删除 /dev/shm/heartbeat_* 文件除非你确定是当前节点的残留!

方法 B:更彻底的方式 —— 使用 debugfs.ocfs2 清理残留心跳区(高级)

1. 找到 OCFS2 设备名(从 multipath 输出可知是 dm-0)

1lsblk | grep dm-0 2# 应该对应 /dev/mapper/241bca12686fc07e76c9ce90052a31b69

2. 以只读方式挂载调试工具

1debugfs.ocfs2 -n /dev/mapper/241bca12686fc07e76c9ce90052a31b69
进入 debugfs 后:
1debugfs: ls -l 2debugfs: cat heartbeat 3# 查看哪些节点有心跳记录 4debugfs: quit

3. 如果发现 cvknode1 的 node ID 仍有心跳,可尝试清除(需极其小心!)

 官方推荐做法不是手动删心跳,而是通过“rehost”机制让集群自动回收。


 步骤三:在管理平台上执行“重新托管(Rehost)”

根据报错提示:“please remove it manually or rehost.”
 最安全、最推荐的做法是在 CAS 管理平台 中对 cvknode1 执行“重新托管”。

操作步骤:

  1. 登录超融合管理平台 → 主机管理 → 选中 cvknode1
  2. 点击右上角【更多操作】→【重新托管】(或叫“重新加入集群”、“Rehost”)
  3. 系统会自动:
    • 停止所有本地 VM
    • 卸载共享存储
    • 清除本地集群缓存
    • 重新注册到集群
    • 重新挂载共享存储
 成功后,存储池状态应变为“活动”,且无报错。


 步骤四:若“重新托管”失败 → 手动清理 + 重启服务

如果图形界面操作无效,回到命令行:
1# 在 cvknode1 上执行 2 3# 1. 停止所有虚拟机(如有) 4virsh list --all | awk "{print $2}" | xargs -I {} virsh shutdown {} 5 6# 2. 卸载共享存储 7umount /vms/cas 8 9# 3. 停止集群服务 10service o2cb stop 11service ocfs2 stop 12 13# 4. 清除集群配置缓存(谨慎!) 14rm -rf /etc/ocfs2/cluster.conf.bak 15cp /etc/ocfs2/cluster.conf /etc/ocfs2/cluster.conf.bak 16 17# 编辑 cluster.conf,确保只有当前活跃节点 18vi /etc/ocfs2/cluster.conf 19# 删除或注释掉 cvknode1 的条目(如果你打算让它暂时离线) 20 21# 5. 重启服务 22service o2cb start 23service ocfs2 start 24 25# 6. 重新挂载 26mount -t ocfs2 -o _netdev,datavolume,nointr /dev/mapper/241bca12686fc07e76c9ce90052a31b69 /vms/cas
然后回到管理平台刷新页面,看是否恢复。


 步骤五:预防未来再次发生

 建议措施:

  1. 启用 HA 和自动故障转移
    • 确保 CVK 节点间网络稳定(心跳网独立)
    • 配置合理的超时时间(如 o2cb heartbeat_threshold = 30
  2. 避免强制断电或 kill 进程
    • 所有维护操作应通过管理平台进行
  3. 定期监控 OCFS2 状态
    1cat /proc/fs/ocfs2/nodemask 2dmesg | grep -i ocfs2
  4. 升级 CAS 版本
    • 某些早期版本存在 OCFS2 心跳泄漏 Bug,升级到最新版可修复

暂无评论

粉丝:43人 关注:1人

HBA卡那里强制扫描一下

暂无评论

粉丝:2人 关注:9人

需要补充以下信息才能准确定位:
1. 存储类型(FC-SAN还是IP-SAN)及具体型号
2. 主机HBA卡型号及驱动版本
3. FC交换机型号及配置(zone划分)
4. CAS主机存储网络配置(多路径、WWN信息)

初步排查步骤:
1. 检查物理连接:`display interface brief` 查看FC端口状态
2. 检查WWN识别:登录存储管理界面,确认主机WWN是否正常注册
3. 检查zone配置:在FC交换机执行 `show zoneset active` 确认主机与存储LUN在同一zone
4. 检查多路径:`multipath -ll` 查看路径状态
5. 检查主机日志:`dmesg | grep -i scsi` 查看SCSI设备发现日志

如果是IP-SAN存储,还需检查:
1. 网络连通性:`ping` 存储IP
2. iSCSI会话:`iscsiadm -m session` 查看会话状态
3. 防火墙规则:`iptables -L` 检查3260端口是否开放

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明