固态硬盘(SSD、NVME、M.2)存在固定的擦写次数,在使用过程中寿命会随着擦写次数增加寿命逐渐减少,损耗的频率受多种因素影响,如硬盘类型、容量大小、业务读写模式等。分布式存储由于其实现原理,数据IO相对均衡的落在不同硬盘上,因此集群内硬盘剩余寿命会存在几乎同时耗尽的可能。当多个节点的多块硬盘剩余寿命同时濒临耗尽时,若继续使用会存在性能数据下降和跨节点多块硬盘批量故障的风险,造成用户数据丢失。因此在日常运维过程中需要密切关注SSD磨损度。
注:阵列卡型号会决定查询使用的指令,硬盘型号会决定查询的字段,因此不同阵列卡下不同类型的SSD,查询方法均不相同
1、确认节点使用的阵列卡型号和SSD型号,如果是LSI阵列卡且intel SSD可以使用本案例
2、使用指令/opt/MegaRAID/storcli/storcli64 /call show|grep -A 30 "PD LIST :"查询SSD的DID号
2、使用指令smartctl -a -d megaraid,DID /dev/sdx,查询SSD盘寿命
注:盘符信息可以随便填写,对指令查询情况无影响,DID务必保证填写正确。即本例中可以使用smartctl -a -d megaraid,23 /dev/sdn查询,如果需要查询准确的盘符,可以使用/opt/MegaRAID/storcli/storcli64 /c0/vall show all,根据DID编号查询盘符,如图:
3、Intel是通过对比Smart233 :Media Wareout Indicator来确认硬盘使用寿命,如图所示本块SSD剩余寿命为99%
建议定期查看SSD剩余寿命,建议在硬盘寿命减少到10%前,就开始进行硬盘更换的准备工作
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作