文档ID:a00142174en_us Last Updated: 2025-01-30
影响范围:
任何支持以下 SSD 的 HPE 服务器,当 通电时间(Power On Hours, POH) 显示超过以下任一阈值时:
56,000 小时
6.5 年
涉及硬盘类型:
Drive Models |
Descriptions |
P/N |
EO000400JWDKP |
HPE 400GB SAS Write Intensive SFF Standard Carrier DS Solid State Drive |
873349-B21 |
EO000400JWDKP |
HPE 400GB SAS 12G Write Intensive 3yr Wty EO000400JWDKP Solid State Drive (SSD) |
873351-B21 |
EO000800JWDKQ |
HPE 800GB SAS Write Intensive SFF Standard Carrier DS Solid State Drive |
873460-B21 |
EO000800JWDKQ |
HPE 800GB SAS 12G Write Intensive 3yr Wty EO000800JWDKQ SSD |
873355-B21 |
EO001600JWDKR |
HPE 1.6TB SAS 12G Write Intensive 3yr Wty EO001600JWDKR SSD |
873357-B21 |
MO000400JWDKU |
HPE 400GB SAS 12G Mixed Use 3yr Wty MO000400JWDKU SSD |
873359-B21 |
MO000800JWDKV |
HPE 800GB SAS 12G Mixed Use 3yr Wty MO000400JWDKU SSD |
873363-B21 |
MO001600JWDLA |
HPE 1.6TB SAS 12G Mixed Use 3yr Wty MO001600JWDLA SSD |
873365-B21 |
MO003200JWDLB |
HPE 3.2TB SAS 12G Mixed Use 3yr Wty MO003200JWDLB SSD |
873367-B21 |
Drive Models |
Descriptions |
P/N |
EO000400JWUGC |
HPE 400GB SAS WI SFF SC DS SSD |
P09098-B21 |
EO000800JWUGD |
HPE 800GB SAS WI SFF SC DS SSD |
P09100-B21 |
EO001600JWUGE |
HPE 1.6TB SAS WI SFF SC DS SSD |
P09102-B21 |
MO000400JWUFT |
HPE 400GB SAS MU SFF SC DS SSD |
P09088-B21 |
MO000800JWUFU |
HPE 800GB SAS MU SFF SC DS SSD |
P09090-B21 |
MO001600JWUFV |
HPE 1.6TB SAS MU SFF SC DS SSD |
P09092-B21 |
MO003200JWUGA |
HPE 3.2TB SAS MU SFF SC DS SSD |
P09094-B21 |
MO006400JWUGB |
HPE 6.4TB SAS MU SFF SC DS SSD |
P09096-B21 |
Drive Models |
Descriptions |
P/Ns |
EO000400JXBEU |
HPE 400GB SAS WI SFF SC SSD |
P21125-B21 |
EO000800JXBFL |
HPE 800GB SAS WI SFF SC SSD |
P21127-B21 |
EO001600JXBFN |
HPE 1.6TB SAS WI SFF SC SSD |
P21129-B21 |
MO000800JXBEV |
HPE 800GB SAS MU SFF SC MV SSD |
P49046-B21 |
MO000960JXBFA |
HPE 960GB SAS RI SFF SC MV SSD |
P49028-B21 |
MO001600JXBFP |
HPE 1.6TB SAS MU SFF SC SSD |
P21133-B21 |
MO001920JXBFT |
HPE 1.92TB SAS RI SFF SC MV SSD |
P49030-B21 |
MO003200JXBFQ |
HPE 3.2TB SAS MU SFF SC MV SSD |
P49052-B21 |
MO003840JXBFU |
HPE 3.84TB SAS RI SFF SC MV SSD |
P49034-B21 |
MO006400JXBFR |
HPE 6.4TB SAS MU SFF SC MV SSD |
P49056-B21 |
MO007680JXBGA |
HPE 7.68TB SAS RI SFF SC SSD |
P21145-B21 |
MO015360JXBFV |
HPE 15.36TB SAS RI SFF SC MV SSD |
P49044-B21 |
注意:HPE Gen10 服务器不支持 MegaRaid (MR) 控制器或 VROC,而是支持 HPE MCHP 系列控制器。(VROC 支持从 HPE Gen10 Plus 系统开始。)
某些 SSD 的固件异常会导致硬盘重新启动。重新启动频率是周期性的,每半小时到一小时发生一次。只有在硬盘使用时间超过 56,000 小时(即 6.5 年)后才会出现此问题。有关使用时间的信息显示在通电时间 (POH) 字段中。
> 如果硬盘用于存储操作系统,此问题可能会导致内核崩溃并出现 BSOD。在极少数情况下,当硬盘在重新启动过程中挂起时,操作系统(OS)的一些关键文件可能会损坏,这需要操作系统镜像来恢复数据。
> 如果硬盘是RAID卷的一部分,那么RAID卷将尝试执行重建,这将导致性能下降。此外,如果硬盘在重建完成之前重新启动,则会导致RAID卷重建失败,并一次又一次地触发重建周期,永远无法恢复RAID卷。如果RAID组中多个硬盘同时故障,可能导致数据无法恢复,只能从备份介质中恢复。
SSA实用程序将以年为单位显示 POH 字段条目。可以参考手册 HPE Smart Storage Administrator (SSA) – Quick Guide to Determine SSD Power on Hours.
注意:每个硬盘管理员可能以不同方式显示此 POH 信息。(如有必要,请访问 HPE 支持中心以查找有关如何查找 POH 信息的相应信息。)
开源工具“Smartmontools”可以实现与 SSA 实用程序相同的功能。(要使用此开源工具,请找到并安装适当版本的 smartmontools,然后按照 smartmontools 安装的分发提示进行操作。)
例如,在 smartmontools 中要发现硬盘是否已使用超过 6.5 年或 3,418,669.8 分钟,请使用以下命令:
alf-rmc-sdf-p0:~ # smartctl --scan
/dev/sda -d scsi # /dev/sda, SCSI device
/dev/bus/0 -d megaraid,6 # /dev/bus/0 [megaraid_disk_06], SCSI device
/dev/bus/0 -d megaraid,7 # /dev/bus/0 [megaraid_disk_07], SCSI device
/dev/bus/0 -d megaraid,9 # /dev/bus/0 [megaraid_disk_09], SCSI device
/dev/bus/0 -d megaraid,10 # /dev/bus/0 [megaraid_disk_10], SCSI device
alf-rmc-sdf-p0:~ # smartctl -d megaraid,6 -a /dev/sda
smartctl 7.2 2021-09-14 r5237 [x86_64-linux-5.14.21-150400.24.111-default] (SUSE RPM)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, ***.***
注意:上面示例中的 Linux 命令可能与您的操作系统或 Linux 发行版不同。
示例:
The data below is an example of a specific version of smartmontool output:
=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK
Current Drive Temperature: 39 C
Drive Trip Temperature: 60 C
Accumulated power on time, hours:minutes 31326:50
Manufactured in week 34 of year 2017
Specified cycle count over device lifetime: 10000
Accumulated start-stop cycles: 506
Specified load-unload count over device lifetime: 300000
Accumulated load-unload cycles: 1830
Elements in grown defect list: 0
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 077 064 044 Pre-fail Always - 50079291
3 Spin_Up_Time 0x0003 095 095 070 Pre-fail Always - 0
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 091 064 030 Pre-fail Always - 1358777742
9 Power_On_Hours 0x0032 050 050 000 Old_age Always - 43804
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
180 Unknown_HDD_Attribute 0x003b 100 100 030 Pre-fail Always - 48312991
194 Temperature_Celsius 0x0022 039 047 000 Old_age Always - 39 (0 18 0 0 0)
196 Reallocated_Event_Count 0x0033 100 100 010 Pre-fail Always - 0
N/A
要纠正和防止此问题,升级硬盘固件到如下提供的版本:
如下型号硬盘使用固件 version HPD3 :
如下型号硬盘使用固件 version HPD4 :
Online HDD/SSD Flash Component for Linux (x64) - MO000400JWUFT, MO000800JWUFU, MO001600JWUFV, MO003200JWUGA, MO006400JWUGB, EO000400JWUGC, EO000800JWUGD and EO001600JWUGE Drives
Online HDD/SSD Flash Component for VMware ESXi - MO000400JWUFT, MO000800JWUFU, MO001600JWUFV, MO003200JWUGA, MO006400JWUGB, EO000400JWUGC, EO000800JWUGD and EO001600JWUGE Drives
如下型号硬盘使用固件 version HPD2 :
Online HDD/SSD Flash Component for Linux (x64) - MO000800JXBEV, MO001600JXBFP, MO003200JXBFQ, MO006400JXBFR, MO000960JXBFA, MO001920JXBFT, MO003840JXBFU, MO007680JXBGA, MO015360JXBFV, EO000400JXBEU, EO000800JXBFL and EO001600JXBFN Drives
Online HDD/SSD Flash Component for VMware ESXi - MO000800JXBEV, MO001600JXBFP, MO003200JXBFQ, MO006400JXBFR, MO000960JXBFA, MO001920JXBFT, MO003840JXBFU, MO007680JXBGA, MO015360JXBFV, EO000400JXBEU, EO000800JXBFL and EO001600JXBFN Drives
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作