固态硬盘(SSD、NVME、M.2)存在固定的擦写次数,在使用过程中寿命会随着擦写次数增加寿命逐渐减少,损耗的频率受多种因素影响,如硬盘类型、容量大小、业务读写模式等。分布式存储由于其实现原理,数据IO相对均衡的落在不同硬盘上,因此集群内硬盘剩余寿命会存在几乎同时耗尽的可能。当多个节点的多块硬盘剩余寿命同时濒临耗尽时,若继续使用会存在性能数据下降和跨节点多块硬盘批量故障的风险,造成用户数据丢失。因此在日常运维过程中需要密切关注SSD磨损度。
注:阵列卡型号会决定查询使用的指令,硬盘型号会决定查询的字段,因此不同阵列卡下不同类型的SSD,查询方法均不相同
1、使用sg_map -i指令查询阵列卡型号的sg编号,如此图阵列卡为sg27
2、arcconf list 1 |grep "Physical Device information" -A 60查看SSD盘的DID号(从0依次往下编号)
3、smartctl -a -d cciss,7 /dev/sg27,查看缓存盘寿命
注:7为SSD盘对应的DID,sg27为阵列卡编号,请根据现场时间情况填写
4、Mircon SSD磨损率是从Smart202:Percentage Of The Rated Lifetime Used查看剩余寿命,如图可知此块SSD剩余寿命为20%
建议定期查看SSD剩余寿命,建议在硬盘寿命减少到10%前,就开始进行硬盘更换的准备工作
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作