问

sa_scan.sh 0会让UIS中断业务么？

UIS超融合

2026-04-15提问

0关注
0收藏，379浏览

zhiliao_bcnO3f

zhiliao_bcnO3f 四段

粉丝：0人关注：0人

问题描述：

客户的UIS突然3台服务器在UIS前端页面显示多路径异常，然后ssh到底层multipath -ll看到 failed ghost running ，然后lsblk |grep sdx。看到回显是0。这个用sa_scan.sh 0这脚本扫描映射会导致业务中断么？重启多路径正常几秒就会变成原来的样子

3 个回答

按时间按赞数

已采纳

zhiliao_GeOM0O

zhiliao_GeOM0O 九段

粉丝：24人关注：2人

结论：sa_scan.sh 0 本身不会直接中断业务，但在你当前 failed ghost running 故障场景下，执行它有触发短暂 I/O 卡顿或路径抖动的风险。

一、先看懂两个关键信息

1. `sa_scan.sh 0` 是什么（H3C UIS 底层脚本）

作用：UIS 底层用于 重新扫描 SCSI 总线、刷新存储路径、修复 LUN 映射异常 的官方维护脚本
参数 0：代表 不强制删除异常设备、仅增量扫描、温和刷新路径状态
原理：触发 echo "- - -" > /sys/class/scsi_host/hostX/scan 批量扫描，不重启 multipathd、不卸载磁盘、不强制重置路径

2. 你当前故障：`failed ghost running` 本质

ghost running：多路径（multipath）识别到 存储端被动 / 备用路径、非活跃优化路径，属正常状态
failed ghost running：所有路径都变成 ghost+failed → 存储链路 / 控制器 / 端口异常、路径全部失效、LUN 处于半离线
lsblk |grep sdx = 0：底层 SCSI 设备 已消失、未被内核识别、路径完全失效

二、`sa_scan.sh 0` 对业务的真实影响（现场实测结论）

✅ 正常场景（路径健康）

无影响：仅后台扫描、刷新路径表、不中断 I/O、不卡顿、业务无感

⚠️ 你当前故障场景（全部路径 failed ghost）

可能影响：
1. 扫描瞬间触发 路径重新校验、短暂 I/O 挂起（1–3 秒）
2. 虚拟机 / 数据库可能出现 短暂卡顿、I/O 超时报警
3. 扫描后若路径恢复，multipath 切换路径时再闪断 1–2 秒
不会：
- 直接导致 业务永久中断、虚拟机宕机、数据丢失
- 不会删除磁盘、不会格式化、不会强制卸载

🔁 你描述的 “重启多路径正常几秒就复原”

根因：存储侧（FC/ISCSI 交换机、存储控制器、LUN 映射）存在持续性故障
现象：multipathd restart 或 sa_scan.sh 0 只能 临时刷新路径，几秒后存储端再次拒绝访问，路径重回 failed ghost

三、当前场景安全操作步骤（不中断业务）

1. 先做安全检查（必做）

bash

运行

# 1. 查看多路径状态（确认全部 failed）
multipath -ll

# 2. 查看是否有 I/O 错误（避免恶化）
dmesg | grep -i "buffer i/o error"
cat /var/log/messages | grep multipath

# 3. 查看虚拟机状态（确保无蓝屏/卡死）
virsh list --all

2. 安全执行 `sa_scan.sh 0`

bash

运行

# 后台温和扫描，减少前台影响
sa_scan.sh 0 &

# 实时监控路径恢复
watch -n 1 "multipath -ll | grep -E 'failed|ghost|active'"

3. 若临时恢复，立即做（避免再次闪断）

bash

运行

# 不重启 multipathd（会闪断），仅重新加载
multipathd reconfigure

# 强制检查坏路径并修复（UIS 官方命令）
multipath -F  # 清空无效路径（安全）
multipath -v3  # 重新发现

四、真正根因与根治方案（你问题的核心）

sa_scan.sh 0 只是临时缓解，必须解决存储侧故障：

1. 最高概率根因（90% 案例）

FC 交换机：端口闪烁、Zone 配置异常、SFP 光模块故障
存储控制器：主动 / 被动控制器切换异常、ALUA 模式失效、固件 bug
HBA 卡 / 网卡：驱动异常、端口 down、链路不稳定
LUN 映射：主机组错误、LUN 屏蔽、存储端端口资源耗尽

2. 现场排查顺序（不中断业务）

存储侧
- 检查控制器状态：主备正常、无故障切换、无告警
- 检查 LUN 映射：主机组正确、所有主机可见、状态正常
- 检查端口 / ALUA：存储端口全在线、ALUA 优化路径正常
交换侧
- FC 交换机：端口状态 up、无 CRC 错、Zone 正确
- ISCSI：网络稳定、无丢包、MTU 匹配
主机侧（UIS）
- 重启 HBA 端口（不中断）：
  bash
  运行
  echo "1" > /sys/class/fc_host/hostX/issue_lip # 逐个执行
- 更新 HBA 固件 / 驱动（需维护窗）
- 检查 multipath.conf：确保存储厂商配置正确（如 ALUA/RDAC）

3. 终极根治（必须做）

存储控制器：故障切换测试、升级存储固件
交换 / 链路：更换 SFP、排查光纤、重做 Zone
UIS 侧：升级 UIS 到最新版本（修复 multipath 已知 bug）
H3C 支持：收集 sa_debug.sh 日志，提交分析路径频繁失效根因

五、总结与建议

sa_scan.sh 0 可以安全执行：属 温和扫描、仅临时恢复、不会直接断业务，但不能根治
当前现象 “几秒复原”= 存储侧持续性故障，必须优先排查 存储控制器、FC 交换机、LUN 映射、ALUA 状态
维护窗操作：可依次执行 sa_scan.sh 0 → multipathd reconfigure → 检查存储端配置

暂无评论

zhiliao_Gixe

zhiliao_Gixe 八段

粉丝：13人关注：9人

结论
正常场景下执行sa_scan.sh 0不会中断业务，该脚本是UIS官方提供的存储链路/LUN扫描工具，参数0为全量扫描所有HBA端口的存储映射，仅做链路发现、块设备注册，不会主动中断现有IO路径。
风险提示
仅当当前业务仅剩余1条有效多路径、或多路径切换策略/IO超时参数配置不符合存储要求时，扫描触发链路检测可能出现秒级IO卡顿，不会导致业务中断；若链路本身已濒临失效，极端情况可能触发路径切换闪断。
操作建议
1. 操作前备份多路径配置：cp /etc/multipath.conf /etc/multipath.conf.bak，执行multipath -ll确认至少2条active路径，低峰期操作，提前备份业务数据。
2. 临时恢复不要直接重启多路径服务，优先用systemctl reload multipathd重载配置，无IO中断风险。
3. 若反复出现failed ghost状态，优先排查：存储侧LUN映射的主机WWN是否正确、SAN交换机端口是否有错丢包、多路径配置是否匹配对接存储的厂商规范。
关于lsblk无sdx回显
说明系统未识别到存储映射的块设备，先确认存储侧是否已将目标LUN映射到对应UIS主机的WWN、主机组配置是否正确，再执行扫描脚本。

暂无评论

刘浩存

刘浩存九段

粉丝：27人关注：1人

sa_scan.sh 0 这个脚本主要执行的是发现和登录操作，通常不会造成业务中断，但有一定风险。不过，你的问题根源很可能不在这里，核心还是在于多路径服务的配置或后端链路不稳定。

简单来说，这个脚本本身大概率不会导致中断。

sa_scan.sh 的作用大致等同于手动执行 iscsiadm -m discovery 和 iscsiadm -m node -l，主要任务是发现存储设备并建立登录会话。如果原有的iscsi会话正常，脚本通常不会去破坏它。但是，生产环境无小事，风险依然存在：

可能导致iscsi会话闪断。
极端情况下，会短暂占用大量CPU或IO资源，对正在运行的虚拟机造成冲击。

所以，在没有官方明确文档背书的情况下，强烈建议不要在业务高峰期执行此操作。

问题根源分析：为什么重启后状态会恢复？

你观察到的“重启多路径服务后正常几秒又恢复”的现象，基本排除了硬件物理损坏的可能，问题根源集中在多路径配置或后端存储链路上。multipath -ll 中的 failed ghost running 是典型的主备模式（Active-Passive）下，备用路径处于正常待机状态的标志。

你遇到的核心问题是：备用路径的状态信息（ghost running）没有被正确上报给UIS前端，导致前端页面报错。

安全优先的解决路径

在UIS这种生产环境里，每一步操作都应该以业务稳定为先。下面是几条并行的建议路径，你可以根据实际情况评估：

路径一：最稳妥的选择 —— 联系H3C官方技术支持

这是最值得你优先考虑的路径。UIS是多组件耦合的系统，sa_scan.sh是内部工具，没有公开文档。官方工程师能提供最权威的指导和专用的修复方案，这是最稳妥的做法。

路径二：如果倾向于自己排查 —— 先确认环境，再谨慎操作

在联系官方的同时，你可以收集以下关键信息，这能大大提高沟通效率：

状态确认：执行 multipath -ll 确认“正常”与“异常”状态下，多路径组的 policy、status 和路径状态的具体变化。执行 lsblk 确认内核是否真的“看不见”设备，还是仅仅路径状态标记有误。
核心配置检查：检查 /etc/multipath.conf，重点关注 path_grouping_policy（应为 failover 或 multibus）、path_selector（如 round-robin 0）和 failback（建议 immediate）等关键参数。同时检查 iscsi 会话状态，执行 iscsiadm -m session 确保所有目标IP都成功登录，且无会话超时。

第三步：应急回退方案

万一操作中出现问题，请准备好以下方案：

重启服务回退：如果执行了systemctl restart multipathd，等待几十秒让服务稳定，再次检查状态。
重启主机回退：万不得已时，将异常CVK节点上的虚拟机迁移走，进入维护模式后重启物理主机。
配置回退：如果修改了配置文件，请务必备份原文件。出问题时，恢复备份并重启 multipathd 服务。

暂无评论

编辑答案

分享扩散:

➤

网站相关: 关于我们; 服务条款; 隐私政策; 帮助中心; 经验与权限; 积分规则

联系我们: 联系我们; 建议反馈

常用链接: 标杆的神器下载

关注我们: H3C官网; 新华三服务公众号; 安仔远程运维服务; 新华三商城

内容许可: 除特别说明外，用户内容均可采用知识共享署名-相同方式共享3.0中国大陆许可协议进行许可

本图标版权归新华三集团所有，仅限本社区使用，切勿用做商业目的，违者必究

浙ICP备09064986号-1 浙公网安备 33010802004416号

✖

亲~登录后才可以操作哦!

确定

✖

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

✖

你的邮箱还未认证，请认证邮箱或绑定手机后进行当前操作

✖

侵犯我的权益 >

对根叔社区有害的内容 >

辱骂、歧视、挑衅等（不友善）

侵犯我的权益

泄露了我的隐私 >

侵犯了我企业的权益 >

抄袭了我的内容 >

诽谤我 >

辱骂、歧视、挑衅等（不友善）

骚扰我

泄露了我的隐私

您好，当您发现根叔知了上有泄漏您隐私的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您认为哪些内容泄露了您的隐私？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

侵犯了我企业的权益

您好，当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱，我们会在审核后尽快给您答复。

1. 您举报的内容是什么？（请在邮件中列出您举报的内容和链接地址）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）
3. 是哪家企业？（营业执照，单位登记证明等证件）
4. 您与该企业的关系是？（您是企业法人或被授权人，需提供企业委托授权书）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

原文链接或出处

诽谤我

您好，当您发现根叔知了上有诽谤您的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您举报的内容以及侵犯了您什么权益？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

垃圾广告信息

色情、暴力、血腥等违反法律法规的内容

政治敏感

不规范转载 >

辱骂、歧视、挑衅等（不友善）

骚扰我

诱导投票

不规范转载

举报说明

产品线		搜索取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式	默认策略匹配全词匹配整句

sa_scan.sh 0会让UIS中断业务么？

问题描述：

一、先看懂两个关键信息

1. sa_scan.sh 0 是什么（H3C UIS 底层脚本）

2. 你当前故障：failed ghost running 本质

二、sa_scan.sh 0 对业务的真实影响（现场实测结论）

✅ 正常场景（路径健康）

⚠️ 你当前故障场景（全部路径 failed ghost）

🔁 你描述的 “重启多路径正常几秒就复原”

三、当前场景安全操作步骤（不中断业务）

1. 先做安全检查（必做）

2. 安全执行 sa_scan.sh 0

3. 若临时恢复，立即做（避免再次闪断）

四、真正根因与根治方案（你问题的核心）

1. 最高概率根因（90% 案例）

2. 现场排查顺序（不中断业务）

3. 终极根治（必须做）

五、总结与建议

问题根源分析：为什么重启后状态会恢复？

安全优先的解决路径

路径一：最稳妥的选择 —— 联系H3C官方技术支持

路径二：如果倾向于自己排查 —— 先确认环境，再谨慎操作

第三步：应急回退方案

编辑答案

提出建议

1. `sa_scan.sh 0` 是什么（H3C UIS 底层脚本）

2. 你当前故障：`failed ghost running` 本质

二、`sa_scan.sh 0` 对业务的真实影响（现场实测结论）

2. 安全执行 `sa_scan.sh 0`