• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

请问这俩个问题怎么排查

  • 0关注
  • 0收藏,542浏览
2 个回答
粉丝:10人 关注:0人

错误1:集群HA存储故障处理策略配置检查不通过​

问题描述:

cluster 中控数据中心-X86/ARM/DMZ区-X86 的 ​​HA storage-failure-response​​ 属性未保持默认值 'No Action'

排查步骤:

  1. ​确认当前配置​
    登录集群各节点执行命令:

    bash
    复制
    # Pacemaker集群检查 pcs resource show | grep -A5 "存储资源名称" # 或 crm configure show

    重点检查 storage-failure-response 的当前值。

  2. ​检查配置变更原因​

    • 审查集群变更记录,确认是否人为修改过故障响应策略
    • 检查自动化运维脚本中是否包含相关配置修改指令
    • 验证第三方存储插件(如DRBD、OCFS2)是否自动覆盖配置
  3. ​评估策略影响​

    当前设置值风险说明
    standby存储故障时节点进入待机,可能导致服务中断
    fence触发节点隔离,可能引发脑裂风险
    panic直接内核崩溃,造成不可控宕机
  4. ​恢复默认配置​

    bash
    复制
    # 批量修复所有节点 pcs property set storage-failure-respOnse=no-action --all # 验证配置 pcs property list | grep storage-failure-response
  5. ​根本原因预防​

    • 在 /etc/sysconfig/ha 添加配置锁:
      LOCK_HA_COnFIG=yes
    • 启用配置审计:
      auditctl -w /etc/cluster/ -p wa

​错误2:OCFS2共享文件系统心跳网络配置不通过​

问题描述:

共享文件系统 7f9b4ddc4327480fa8026612a2db6891 使用​​默认网络​​传输心跳

排查步骤:

  1. ​定位问题文件系统​

    bash
    复制
    # 通过UUID查找挂载点 ocfs2_find_vol /dev/mapper/* | grep 7f9b4ddc4327480fa8026612a2db6891
  2. ​检查当前网络配置​

    bash
    复制
    # 查看OCFS2集群配置 cat /etc/ocfs2/cluster.conf # 验证心跳网络接口 o2info -v /mnt/ocfs2_mount_point | grep Heartbeat
  3. ​配置专用心跳网络​

    bash
    复制
    # 修改集群配置文件 vi /etc/ocfs2/cluster.conf

    添加节点专用心跳配置:

    ini
    复制
    node: number = 1 name = node1 cluster = ocfs2 ip_address = 192.168.1.10 # 业务IP ip_port = 7777 heartbeat = 10.10.10.10 # 专用心跳IP <<< 关键配置
  4. ​应用新配置​

    bash
    复制
    # 重载所有节点配置 service o2cb reload # 重启OCFS2服务 service ocfs2 restart && service o2cb restart
  5. ​验证优化效果​

    bash
    复制
    # 查看心跳包路径 tcpdump -i eth1 'port 7777' -nn # eth1为心跳网卡 # 检查网络延迟 ocfstool -T /mnt/ocfs2_mount_point

​关键预防措施​

问题类型监控命令自动化修复方案
HA存储策略`pcs statusgrep -i storage-failure`
OCFS2网络o2ping -t 1000 <节点IP>部署Zabbix监控心跳延迟

​重要提示​​:

  1. 修改前备份集群配置:pcs config backup /root/pcs_backup_$(date +%F)
  2. 变更操作需在​​维护窗口​​进行
  3. 测试环境验证后再上生产

暂无评论

粉丝:32人 关注:1人

第一个在集群HA功能那里配置

第二个是误告警可以不用管

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明