问

请问这俩个问题怎么排查

2025-05-30提问

0关注
0收藏，1750浏览

虚心请教努力学习

虚心请教努力学习四段

粉丝：1人关注：5人

问题描述：

2 个回答

按时间按赞数

有飞不起的鸟

有飞不起的鸟九段

粉丝：21人关注：0人

错误1：集群HA存储故障处理策略配置检查不通过

问题描述：

cluster 中控数据中心-X86/ARM/DMZ区-X86 的 HA storage-failure-response 属性未保持默认值 'No Action'

排查步骤：

确认当前配置
登录集群各节点执行命令：
bash
复制
# Pacemaker集群检查 pcs resource show | grep -A5 "存储资源名称" # 或 crm configure show
重点检查 storage-failure-response 的当前值。
检查配置变更原因
- 审查集群变更记录，确认是否人为修改过故障响应策略
- 检查自动化运维脚本中是否包含相关配置修改指令
- 验证第三方存储插件（如DRBD、OCFS2）是否自动覆盖配置
评估策略影响
当前设置值风险说明
standby 存储故障时节点进入待机，可能导致服务中断
fence 触发节点隔离，可能引发脑裂风险
panic 直接内核崩溃，造成不可控宕机
恢复默认配置
bash
复制
# 批量修复所有节点 pcs property set storage-failure-respOnse=no-action --all # 验证配置 pcs property list | grep storage-failure-response
根本原因预防
- 在 /etc/sysconfig/ha 添加配置锁：
  LOCK_HA_COnFIG=yes
- 启用配置审计：
  auditctl -w /etc/cluster/ -p wa

当前设置值	风险说明
`standby`	存储故障时节点进入待机，可能导致服务中断
`fence`	触发节点隔离，可能引发脑裂风险
`panic`	直接内核崩溃，造成不可控宕机

错误2：OCFS2共享文件系统心跳网络配置不通过

问题描述：

共享文件系统 7f9b4ddc4327480fa8026612a2db6891 使用默认网络传输心跳

排查步骤：

定位问题文件系统
bash
复制
# 通过UUID查找挂载点 ocfs2_find_vol /dev/mapper/* | grep 7f9b4ddc4327480fa8026612a2db6891
检查当前网络配置
bash
复制
# 查看OCFS2集群配置 cat /etc/ocfs2/cluster.conf # 验证心跳网络接口 o2info -v /mnt/ocfs2_mount_point | grep Heartbeat
配置专用心跳网络
bash
复制
# 修改集群配置文件 vi /etc/ocfs2/cluster.conf
添加节点专用心跳配置：
ini
复制
node: number = 1 name = node1 cluster = ocfs2 ip_address = 192.168.1.10 # 业务IP ip_port = 7777 heartbeat = 10.10.10.10 # 专用心跳IP <<< 关键配置
应用新配置
bash
复制
# 重载所有节点配置 service o2cb reload # 重启OCFS2服务 service ocfs2 restart && service o2cb restart
验证优化效果
bash
复制
# 查看心跳包路径 tcpdump -i eth1 'port 7777' -nn # eth1为心跳网卡 # 检查网络延迟 ocfstool -T /mnt/ocfs2_mount_point

关键预防措施

问题类型	监控命令	自动化修复方案
HA存储策略	`pcs status	grep -i storage-failure`
OCFS2网络	`o2ping -t 1000 <节点IP>`	部署Zabbix监控心跳延迟

重要提示：
修改前备份集群配置：pcs config backup /root/pcs_backup_$(date +%F)
变更操作需在维护窗口进行
测试环境验证后再上生产

暂无评论

zhiliao_v6hOyc

zhiliao_v6hOyc 九段

粉丝：44人关注：1人

第一个在集群HA功能那里配置

第二个是误告警可以不用管

暂无评论

编辑答案

分享扩散:

➤

网站相关: 关于我们; 服务条款; 隐私政策; 帮助中心; 经验与权限; 积分规则

联系我们: 联系我们; 建议反馈

常用链接: 标杆的神器下载

关注我们: H3C官网; 新华三服务公众号; 安仔远程运维服务; 新华三商城

内容许可: 除特别说明外，用户内容均可采用知识共享署名-相同方式共享3.0中国大陆许可协议进行许可

本图标版权归新华三集团所有，仅限本社区使用，切勿用做商业目的，违者必究

浙ICP备09064986号-1 浙公网安备 33010802004416号

✖

亲~登录后才可以操作哦!

确定

✖

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

✖

你的邮箱还未认证，请认证邮箱或绑定手机后进行当前操作

✖

侵犯我的权益 >

对根叔社区有害的内容 >

辱骂、歧视、挑衅等（不友善）

侵犯我的权益

泄露了我的隐私 >

侵犯了我企业的权益 >

抄袭了我的内容 >

诽谤我 >

辱骂、歧视、挑衅等（不友善）

骚扰我

泄露了我的隐私

您好，当您发现根叔知了上有泄漏您隐私的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您认为哪些内容泄露了您的隐私？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

侵犯了我企业的权益

您好，当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱，我们会在审核后尽快给您答复。

1. 您举报的内容是什么？（请在邮件中列出您举报的内容和链接地址）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）
3. 是哪家企业？（营业执照，单位登记证明等证件）
4. 您与该企业的关系是？（您是企业法人或被授权人，需提供企业委托授权书）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

原文链接或出处

诽谤我

您好，当您发现根叔知了上有诽谤您的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您举报的内容以及侵犯了您什么权益？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

垃圾广告信息

色情、暴力、血腥等违反法律法规的内容

政治敏感

不规范转载 >

辱骂、歧视、挑衅等（不友善）

骚扰我

诱导投票

不规范转载

举报说明

产品线		搜索取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式	默认策略匹配全词匹配整句

请问这俩个问题怎么排查

问题描述：

错误1：集群HA存储故障处理策略配置检查不通过​​

问题描述：

排查步骤：

​​错误2：OCFS2共享文件系统心跳网络配置不通过​​

问题描述：

排查步骤：

​​关键预防措施​​

编辑答案

提出建议

错误1：集群HA存储故障处理策略配置检查不通过

错误2：OCFS2共享文件系统心跳网络配置不通过

关键预防措施