• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

sa_scan.sh 0会让UIS中断业务么?

19小时前提问
  • 0关注
  • 0收藏,25浏览
粉丝:0人 关注:0人

问题描述:

客户的UIS突然3台服务器在UIS前端页面显示多路径异常,然后ssh到底层multipath -ll看到 failed ghost running ,然后lsblk  |grep sdx。看到回显是0。这个用sa_scan.sh 0这脚本扫描映射会导致业务中断么?重启多路径正常几秒就会变成原来的样子

3 个回答
粉丝:2人 关注:9人

结论
正常场景下执行sa_scan.sh 0不会中断业务,该脚本是UIS官方提供的存储链路/LUN扫描工具,参数0为全量扫描所有HBA端口的存储映射,仅做链路发现、块设备注册,不会主动中断现有IO路径。
风险提示
仅当当前业务仅剩余1条有效多路径、或多路径切换策略/IO超时参数配置不符合存储要求时,扫描触发链路检测可能出现秒级IO卡顿,不会导致业务中断;若链路本身已濒临失效,极端情况可能触发路径切换闪断。
操作建议
1. 操作前备份多路径配置:cp /etc/multipath.conf /etc/multipath.conf.bak,执行multipath -ll确认至少2条active路径,低峰期操作,提前备份业务数据。
2. 临时恢复不要直接重启多路径服务,优先用systemctl reload multipathd重载配置,无IO中断风险。
3. 若反复出现failed ghost状态,优先排查:存储侧LUN映射的主机WWN是否正确、SAN交换机端口是否有错丢包、多路径配置是否匹配对接存储的厂商规范。
关于lsblk无sdx回显
说明系统未识别到存储映射的块设备,先确认存储侧是否已将目标LUN映射到对应UIS主机的WWN、主机组配置是否正确,再执行扫描脚本。

暂无评论

粉丝:9人 关注:2人

结论:sa_scan.sh 0 本身不会直接中断业务,但在你当前 failed ghost running 故障场景下,执行它有触发短暂 I/O 卡顿或路径抖动的风险。

一、先看懂两个关键信息

1. sa_scan.sh 0 是什么(H3C UIS 底层脚本)

  • 作用:UIS 底层用于 重新扫描 SCSI 总线、刷新存储路径、修复 LUN 映射异常 的官方维护脚本
  • 参数 0:代表 不强制删除异常设备、仅增量扫描、温和刷新路径状态
  • 原理:触发 echo "- - -" > /sys/class/scsi_host/hostX/scan 批量扫描,不重启 multipathd、不卸载磁盘、不强制重置路径

2. 你当前故障:failed ghost running 本质

  • ghost running:多路径(multipath)识别到 存储端被动 / 备用路径、非活跃优化路径,属正常状态
  • failed ghost running所有路径都变成 ghost+failed存储链路 / 控制器 / 端口异常、路径全部失效、LUN 处于半离线
  • lsblk |grep sdx = 0:底层 SCSI 设备 已消失、未被内核识别、路径完全失效

二、sa_scan.sh 0 对业务的真实影响(现场实测结论)

✅ 正常场景(路径健康)

  • 无影响:仅后台扫描、刷新路径表、不中断 I/O、不卡顿、业务无感

⚠️ 你当前故障场景(全部路径 failed ghost)

  • 可能影响
    1. 扫描瞬间触发 路径重新校验、短暂 I/O 挂起(1–3 秒)
    2. 虚拟机 / 数据库可能出现 短暂卡顿、I/O 超时报警
    3. 扫描后若路径恢复,multipath 切换路径时再闪断 1–2 秒
  • 不会
    • 直接导致 业务永久中断、虚拟机宕机、数据丢失
    • 不会删除磁盘、不会格式化、不会强制卸载

🔁 你描述的 “重启多路径正常几秒就复原”

  • 根因:存储侧(FC/ISCSI 交换机、存储控制器、LUN 映射)存在持续性故障
  • 现象:multipathd restartsa_scan.sh 0 只能 临时刷新路径几秒后存储端再次拒绝访问,路径重回 failed ghost

三、当前场景安全操作步骤(不中断业务)

1. 先做安全检查(必做)

bash
运行
# 1. 查看多路径状态(确认全部 failed) multipath -ll # 2. 查看是否有 I/O 错误(避免恶化) dmesg | grep -i "buffer i/o error" cat /var/log/messages | grep multipath # 3. 查看虚拟机状态(确保无蓝屏/卡死) virsh list --all

2. 安全执行 sa_scan.sh 0

bash
运行
# 后台温和扫描,减少前台影响 sa_scan.sh 0 & # 实时监控路径恢复 watch -n 1 "multipath -ll | grep -E 'failed|ghost|active'"

3. 若临时恢复,立即做(避免再次闪断)

bash
运行
# 不重启 multipathd(会闪断),仅重新加载 multipathd reconfigure # 强制检查坏路径并修复(UIS 官方命令) multipath -F # 清空无效路径(安全) multipath -v3 # 重新发现

四、真正根因与根治方案(你问题的核心)

sa_scan.sh 0 只是临时缓解,必须解决存储侧故障:

1. 最高概率根因(90% 案例)

  • FC 交换机:端口闪烁、Zone 配置异常、SFP 光模块故障
  • 存储控制器:主动 / 被动控制器切换异常、ALUA 模式失效、固件 bug
  • HBA 卡 / 网卡:驱动异常、端口 down、链路不稳定
  • LUN 映射:主机组错误、LUN 屏蔽、存储端端口资源耗尽

2. 现场排查顺序(不中断业务)

  1. 存储侧
    • 检查控制器状态:主备正常、无故障切换、无告警
    • 检查 LUN 映射:主机组正确、所有主机可见、状态正常
    • 检查端口 / ALUA:存储端口全在线、ALUA 优化路径正常
  2. 交换侧
    • FC 交换机:端口状态 up、无 CRC 错、Zone 正确
    • ISCSI:网络稳定、无丢包、MTU 匹配
  3. 主机侧(UIS)
    • 重启 HBA 端口(不中断):
      bash
      运行
      echo "1" > /sys/class/fc_host/hostX/issue_lip # 逐个执行
    • 更新 HBA 固件 / 驱动(需维护窗)
    • 检查 multipath.conf:确保存储厂商配置正确(如 ALUA/RDAC)

3. 终极根治(必须做)

  • 存储控制器:故障切换测试、升级存储固件
  • 交换 / 链路:更换 SFP、排查光纤、重做 Zone
  • UIS 侧:升级 UIS 到最新版本(修复 multipath 已知 bug)
  • H3C 支持:收集 sa_debug.sh 日志,提交分析路径频繁失效根因

五、总结与建议

  • sa_scan.sh 0 可以安全执行:属 温和扫描、仅临时恢复、不会直接断业务,但不能根治
  • 当前现象 “几秒复原”= 存储侧持续性故障,必须优先排查 存储控制器、FC 交换机、LUN 映射、ALUA 状态
  • 维护窗操作:可依次执行 sa_scan.sh 0multipathd reconfigure → 检查存储端配置

暂无评论

粉丝:11人 关注:1人

sa_scan.sh 0 这个脚本主要执行的是发现和登录操作,通常不会造成业务中断,但有一定风险。不过,你的问题根源很可能不在这里,核心还是在于多路径服务的配置或后端链路不稳定。


简单来说,这个脚本本身大概率不会导致中断。

sa_scan.sh 的作用大致等同于手动执行 iscsiadm -m discovery 和 iscsiadm -m node -l,主要任务是发现存储设备并建立登录会话。如果原有的iscsi会话正常,脚本通常不会去破坏它。但是,生产环境无小事,风险依然存在:

  • 可能导致iscsi会话闪断。

  • 极端情况下,会短暂占用大量CPU或IO资源,对正在运行的虚拟机造成冲击。

所以,在没有官方明确文档背书的情况下,强烈建议不要在业务高峰期执行此操作。


 问题根源分析:为什么重启后状态会恢复?

你观察到的“重启多路径服务后正常几秒又恢复”的现象,基本排除了硬件物理损坏的可能,问题根源集中在多路径配置或后端存储链路上。multipath -ll 中的 failed ghost running 是典型的主备模式(Active-Passive)下,备用路径处于正常待机状态的标志

你遇到的核心问题是:备用路径的状态信息(ghost running)没有被正确上报给UIS前端,导致前端页面报错。


 安全优先的解决路径

在UIS这种生产环境里,每一步操作都应该以业务稳定为先。下面是几条并行的建议路径,你可以根据实际情况评估:

路径一:最稳妥的选择 —— 联系H3C官方技术支持

这是最值得你优先考虑的路径。UIS是多组件耦合的系统,sa_scan.sh是内部工具,没有公开文档。官方工程师能提供最权威的指导和专用的修复方案,这是最稳妥的做法。

路径二:如果倾向于自己排查 —— 先确认环境,再谨慎操作

在联系官方的同时,你可以收集以下关键信息,这能大大提高沟通效率:

  1. 状态确认:执行 multipath -ll 确认“正常”与“异常”状态下,多路径组的 policystatus 和路径状态的具体变化。执行 lsblk 确认内核是否真的“看不见”设备,还是仅仅路径状态标记有误。

  2. 核心配置检查:检查 /etc/multipath.conf,重点关注 path_grouping_policy(应为 failover 或 multibus)、path_selector(如 round-robin 0)和 failback(建议 immediate)等关键参数。同时检查 iscsi 会话状态,执行 iscsiadm -m session 确保所有目标IP都成功登录,且无会话超时。


 第三步:应急回退方案

万一操作中出现问题,请准备好以下方案:

  • 重启服务回退:如果执行了systemctl restart multipathd,等待几十秒让服务稳定,再次检查状态。

  • 重启主机回退:万不得已时,将异常CVK节点上的虚拟机迁移走,进入维护模式后重启物理主机。

  • 配置回退:如果修改了配置文件,请务必备份原文件。出问题时,恢复备份并重启 multipathd 服务。

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明