ONEStor标准组网
当在ONEStor handy界面或X10000 handy界面发现有OSD异常且异常盘的盘符还在,出现如图1所示的情况。如果已经判断为硬件故障问题需要更换硬盘时,在handy界面能够直接删除异常盘,其缓存分区也会一并删除,可以按照如下步骤操作。如果在handy界面无法删除,请按照《HPE 服务器故障硬盘更换操作指南(2)》进行操作。
图1 handy界面显示异常,且盘符还在
如果确定是硬件故障需要更换硬盘,可以按照如下步骤操作。
如下为具体操作步骤:
1、我们首先需要确认硬盘的物理槽位号。
① 首先通过ceph osd tree找到故障硬盘的osd编号,通过输出结果查找到osd状态为down且out的osd,记下该osd的编号。
图2 ceph osd tree查看结果
② 接下来通过lsblk查找osd编号对应在系统下的盘符(类似于sdb、sdc)。
图3 lsblk查看结果
③
图4 查看slot号
注意:此实验机子只有一个slot槽位插了RAID卡,其对应的slot号为1,在实际场景可能有多个slot号,首先需要判断对应的盘在哪个slot上,可通过命令hpssacli ctrl slot=x
show config detail | grep dev (x
图5 查看对应的slot号下的系统盘符
④
注意:此步骤首先查看图6中
Disk Name
图6
⑤
图7 故障盘对应的实际的物理盘
通过上面的操作就可以看到找到故障盘在系统下的盘符是sdc,对应array C,其对应的物理硬盘位置是1I:2:4
2、找到故障盘对应的槽位号后,目前我们需要确认该故障盘在服务器上的什么位置,可以通过如下点灯命令查看(蓝色灯):
开灯:hpssacli ctrl slot=1 array C modify led=on
关灯:hpssacli ctrl slot=1 array C modify led=off
通过上面的开灯、关灯操作就可以确定物理硬盘的具体位置,请注意记录下该位置。
3、在handy界面删除硬盘。
4、通过如下命令删除旧盘的阵列信息。
hpssacli ctrl slot=1 array C delete forced (注意不要删错)
5、根据第2步记录好的故障盘的物理位置拔出故障盘,注意不要拔错盘,然后插上新盘并做好阵列。
hpssacli ctrl slot=1 create type=ld drives=1I:2:4 raid=0
6、做好阵列后,使用命令关闭硬盘的写缓存。
hpssacli ctrl slot=1 modify drivewritecache=disable
7、关闭了硬盘缓存后,在handy界面添加即可。
该案例对您是否有帮助:
您的评价:1
若您有关于案例的建议,请反馈:
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
看报错提示是没有检测到阵列卡控制器,你使用是P440阵列卡么,还是P460的阵列卡,可以使用lsscsi看看阵列卡芯片信息。如果你的阵列卡确实是P440的,但固件比较高,也可以试试使用ssacli ctrl all show (前提是你的服务器有ssacli工具)