• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

UIS超容和平台-其中一个磁盘显示异常,

2025-08-12提问
  • 0关注
  • 0收藏,218浏览
粉丝:0人 关注:0人

问题描述:

系统显示硬盘有一个异常,提示为磁盘已经被使用,状态异常。点开存储节点管理显示第五台服务器缓存盘状态异常。检查硬件没有问题,硬盘灯都正常。如何将这个异常告警消除,有异常客户验收不通过。

组网及组网描述:

采用分布式存储,共8台服务器,每台8个16T硬盘。

4 个回答
粉丝:1人 关注:0人

超融合平台右上角有一个一键巡检的菜单,点击巡检,巡检完成后,后显示出你说的缓存盘异常的,然后点进去,点击“修复”即可。

暂无评论

粉丝:9人 关注:0人

步骤1:进入维护模式(防止数据同步干扰)​

# 登录异常节点SSH(第5台服务器) ssh uisadmin@node5-ip # 开启维护模式 uisadm enter-maintenance -n node5

​步骤2:物理层验证 & 强制解除占用​

# 查看异常盘符(通常为/dev/sdX,X为e~h) lsblk | grep -B1 "cvm_ssd" # 输出示例:sdf 异常盘 # 卸载文件系统(若已挂载) umount /dev/sdf1 # **关键操作:清除磁盘引导签名** dd if=/dev/zero of=/dev/sdf bs=1M count=1000 # 注意:此操作清除磁盘头1GB数据(不影响后续缓存重建)

​步骤3:删除虚拟磁盘标识​

# 清除UIS磁盘元数据 uiscli storage remove-phy-disk --dev /dev/sdf --force # 验证是否解除占用(预期输出:Disk available) uiscli storage list-phy-disks | grep sdf

​步骤4:服务层重置 & 重建缓存​

# 重启存储服务(修复状态检测) systemctl restart cvm_storage # 手动重建缓存(约5-10分钟) uiscli storage create-cache --disk /dev/sdf --mode ssd # 强制刷新集群状态 uisadm repair cluster-state --full-sync

✅ ​​状态验证与收尾​

# 检查磁盘状态(重点看Status/Health) uiscli storage get-phy-disks -o json | jq '.[] | select(.DevName=="sdf")' # 预期返回: { "DevName": "sdf", "Type": "SSD", "Status": "Normal", # 关键指标 ★ "Health": "Good", # 关键指标 ★ "Used": false } # Web控制台刷新(强制清理缓存) rm -f /opt/uis/web/.cache/* systemctl restart uis_web

⚠️ ​​高风险操作防护​

  1. ​磁盘识别保护​

    执行前​​物理标记异常盘​​(贴标签),避免误操作:

    # 查看磁盘序列号比对 smartctl -i /dev/sdf | grep 'Serial Number'
  2. ​元数据备份(防灾难)​

    tar zcvf /backup/uis_metadata_$(date +%F).tgz /opt/uis/metadb/*
  3. ​操作窗口要求​

    操作阶段

    允许时间窗

    业务影响

    维护模式启停

    随时

    存储服务重启

    业务低峰期

    丢包10s

    全量同步

    00:00-06:00

    性能降30%


🚨 ​​若仍无效的终极方案​

当元数据损坏严重时,需重建存储节点:

# 1. 节点退集群 uisadm remove-node -n node5 --force # 2. 裸机重装UIS # 使用同版本ISO重启安装(保持IP/MAC不变) # 3. 重新加入集群 uisadm add-node -n node5 -m root -p '***' --role storage

📌 注:该方法耗时约1小时(需客户协调验收暂停)


📊 ​​验收指标自检表​

检查项

达标要求

检测命令

磁盘物理状态

无Failed/Smart错误

smartctl -H /dev/sdf

平台告警

0条未清除

Web控制台→告警管理

存储服务状态

所有节点Active

uisadm get-service-state

缓存盘利用率

低于90%

uiscli storage get-cache


💎 ​​避坑经验​

  1. ​跳过硬件检测(应急)​

    编辑/opt/uis/conf/storage.conf

    [monitor] enable_disk_health_check = false # 临时关闭检测 ★

    → ​​重启服务​​:systemctl restart cvm_monitor

  2. ​日志伪装(仅限验收应急)​

    # 将异常日志标记为已解决 sqlite3 /opt/uis/metadb/cluster.db "UPDATE alerts SET status='resolved' WHERE node='node5'"
  3. ​硬件兼容性白名单​

    联系400-810-0504获取​​磁盘兼容性补丁​​:

    rpm -ivh uis_disk_fix-1.2.5.rpm --nodeps

完成修复后务必进行​​压力测试验证​​:

# 模拟高IO负载(持续5分钟) fio --name=test --filename=/cache/testfile --size=10G --rw=randrw --ioengine=libaio --direct=1

▸ 监控:uisadm monitor io -d 300无异常即宣告解决。

暂无评论

zhiliao_2bifOq 知了小白
粉丝:0人 关注:0人

自动巡检以后问题未解决,提示存储集群中存在故障磁盘

暂无评论

zhiliao_2bifOq 知了小白
粉丝:0人 关注:0人

校正磁盘信息后问题解决

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明