知

R4900 G6 新上架服务器nvme盘存在media_errors

2026-02-25 发表

0关注
0收藏 921浏览

杨振宇

杨振宇五段

粉丝：1人关注：1人

组网及说明

HDM版本	1.86.02
BIOS版本	6.10.57
CPLD版本	V008
问题硬盘型号	Solidigm SSDPF2KX076T1

告警信息

media_errors：2

问题描述

客户现场新到货47台R4900 G6服务器，问题发生时处于开局部署阶段。客户在监控平台发现47台服务器ad:00.0槽位的nvme盘均存在media_errors计数，且计数都是2，其中一台双nvme盘均存在media_errors计数。现场随机收集了几台机器nvme smart-log信息，发现均存在nvme0n1的media_errors计数为2的现象。

过程分析

1、查看SDS带外日志，未见硬件异常。同时分析报错NVMe槽位、批次等信息，未发现明显异常。查询该硬盘固件版本发现已是最新版本(9CV10510)。

2、现场收集OS日志，在dmesg日志中可以看到安装系统后第一次开机时就已经存在medium error.

3、查看47台机器的硬盘出厂测试记录，发现涉及的硬盘均不存在media_errors计数。

4、厂家对硬盘日志分析情况：现有的log 没有指向NAND failure，Format看起来被某个动作打断，有两笔read返回0x6281 UECC。

日志中Grown detect count=0，可以确认没有新增坏块。

现有的log 不能证明是 NAND failure，Grown Bad Block=0 没有增加， XOR Fail Count=0。并且nvme 协议中smart信息并不存在单独media_errors定义，怀疑nvme smart工具将多种错误合并成了media_errors。

通过厂家日志对硬盘smart信息比对，两块硬盘参数差异仅在End-to-End Error Detection Count计数上：

怀疑nvme smart-log中的media errors计数来源于End-to-End Error Detection Count，于是再次收集一台双nvme盘均存在media_errors的硬盘smart日志进行比对。

发现nvme smart-log中的media_errors与硬盘的smart信息中的End-to-End Error Detection Count值完全一致，可以确定系统下的media erros计数其实是硬盘End-to-End Error Detection Count的值。

解决方法

根据intel原厂分析，现有的log 没有指向硬盘NAND failure， Grown detect count=0，可以确认当前硬盘没有坏块。硬盘的健康状态正常，可以正常使用且不会对业务造成风险。nvme smart-log中的media_errors与硬盘的smart信息中的End-to-End Error Detection Count值完全一致，End-to-End Error代表整条data path上的错误，并不一定是NAND failure；根据NVME标准协议无明确的media error定义，而是使用Media and Data Interrgrity Eorror Vlaues 进行定义，其下包含多种行为。Intel同时说明SMART参数中的Available Spare代表冗余空间使用比例，初始值为100%，下降到10%会触发SMART warning，已提供硬盘日志的Available Spare=100%，建议监控硬盘健康度抓取值更改为“Available Spare”。

该案例对您是否有帮助：

您的评价：1

若您有关于案例的建议，请反馈：

0 个评论

该案例暂时没有网友评论

编辑评论

侵犯我的权益 >

对根叔知了社区有害的内容 >

辱骂、歧视、挑衅等（不友善）

侵犯我的权益

泄露了我的隐私 >

侵犯了我企业的权益 >

抄袭了我的内容 >

诽谤我 >

辱骂、歧视、挑衅等（不友善）

骚扰我

泄露了我的隐私

您好，当您发现根叔知了上有泄漏您隐私的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您认为哪些内容泄露了您的隐私？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

侵犯了我企业的权益

您好，当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱，我们会在审核后尽快给您答复。

1. 您举报的内容是什么？（请在邮件中列出您举报的内容和链接地址）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）
3. 是哪家企业？（营业执照，单位登记证明等证件）
4. 您与该企业的关系是？（您是企业法人或被授权人，需提供企业委托授权书）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

原文链接或出处

诽谤我

您好，当您发现根叔知了上有诽谤您的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您举报的内容以及侵犯了您什么权益？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

垃圾广告信息

色情、暴力、血腥等违反法律法规的内容

政治敏感

不规范转载 >

辱骂、歧视、挑衅等（不友善）

骚扰我

诱导投票

不规范转载

举报说明

✖

案例意见反馈

➤

网站相关: 关于我们; 服务条款; 隐私政策; 帮助中心; 经验与权限; 积分规则

联系我们: 联系我们; 建议反馈

常用链接: 标杆的神器下载

关注我们: H3C官网; 新华三服务公众号; 安仔远程运维服务; 新华三商城

内容许可: 除特别说明外，用户内容均可采用知识共享署名-相同方式共享3.0中国大陆许可协议进行许可

本图标版权归新华三集团所有，仅限本社区使用，切勿用做商业目的，违者必究

浙ICP备09064986号-1 浙公网安备 33010802004416号

✖

亲~登录后才可以操作哦!

确定

✖

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

✖

你的邮箱还未认证，请认证邮箱或绑定手机后进行当前操作

✖

产品线		搜索取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式	默认策略匹配全词匹配整句

R4900 G6 新上架服务器nvme盘存在media_errors

组网及说明

告警信息

问题描述

过程分析

解决方法

编辑评论

提出建议