• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

R4900 G6 新上架服务器nvme盘存在media_errors

2026-02-25 发表
  • 0关注
  • 0收藏 371浏览
粉丝:0人 关注:1人

组网及说明

HDM版本

1.86.02

BIOS版本

6.10.57

CPLD版本

V008

问题硬盘型号

Solidigm SSDPF2KX076T1

告警信息

media_errors:2

问题描述

客户现场新到货47R4900 G6服务器,问题发生时处于开局部署阶段。客户在监控平台发现47台服务器ad:00.0槽位的nvme盘均存在media_errors计数,且计数都是2,其中一台双nvme盘均存在media_errors计数。现场随机收集了几台机器nvme smart-log信息,发现均存在nvme0n1media_errors计数为2的现象。

 

 

过程分析

 

1、查看SDS带外日志,未见硬件异常。同时分析报错NVMe槽位、批次等信息,未发现明显异常。查询该硬盘固件版本发现已是最新版本(9CV10510)

2、现场收集OS日志,在dmesg日志中可以看到安装系统后第一次开机时就已经存在medium error.

3、查看47台机器的硬盘出厂测试记录,发现涉及的硬盘均不存在media_errors计数

4、厂家对硬盘日志分析情况:现有的log 没有指向NAND failureFormat看起来被某个动作打断,有两笔read返回0x6281 UECC

日志中Grown detect count=0,可以确认没有新增坏块。

现有的log 不能证明是 NAND failureGrown Bad Block=0 没有增加, XOR Fail Count=0并且nvme 协议中smart信息并不存在单独media_errors定义,怀疑nvme smart工具将多种错误合并成了media_errors

通过厂家日志对硬盘smart信息比对,两块硬盘参数差异仅在End-to-End Error Detection Count计数上:

怀疑nvme smart-log中的media errors计数来源于End-to-End Error Detection Count,于是再次收集一台双nvme盘均存在media_errors的硬盘smart日志进行比对。

发现nvme smart-log中的media_errors与硬盘的smart信息中的End-to-End Error Detection Count值完全一致,可以确定系统下的media erros计数其实是硬盘End-to-End Error Detection Count的值。

解决方法

 根据intel原厂分析,现有的log 没有指向硬盘NAND failure Grown detect count=0,可以确认当前硬盘没有坏块。硬盘的健康状态正常,可以正常使用且不会对业务造成风险。nvme smart-log中的media_errors与硬盘的smart信息中的End-to-End Error Detection Count值完全一致,End-to-End Error代表整条data path上的错误,并不一定是NAND failure;根据NVME标准协议无明确的media error定义,而是使用Media and Data Interrgrity Eorror Vlaues 进行定义,其下包含多种行为。Intel同时说SMART参数中的Available Spare代表冗余空间使用比例,初始值为100%,下降到10%会触发SMART warning,已提供硬盘日志的Available Spare=100%,建议监控硬盘健康度抓取值更改为“Available Spare”。

该案例对您是否有帮助:

您的评价:1

若您有关于案例的建议,请反馈:

0 个评论

该案例暂时没有网友评论

编辑评论

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作