用户在B390G2服务器上安装的RHEL7.2或者Centos7.2系统下,使用系统的定时工具如cron或脚本计时,定期的运行hpssacli命令来获取阵列卡的状态信息
如下命令
[root@logsrv ~]# hpssacli ctrl all show status
Smart Array P440ar in Slot 1
Controller Status: OK
Cache Status: OK
服务器开始不定时的出行异宕机重启,或者kernel panic
kernel panic系统崩溃时的报错类似如下:
BUG: unable to handle kernel NULL pointer dereference at 0000000000000048 IP: [<ffffffffa0041c52>] hpsa_scsi_ioaccel_queue_command+0x32/0x7f0 [hpsa] RIP: 0010:[<ffffffffa0041c52>] [<ffffffffa0041c52>] hpsa_scsi_ioaccel_queue_command+0x32/0x7f0 [hpsa]在该段panic的信息中,我们可以看到有hpsa的字样。其中hpsa是Smart Array阵列卡的驱动模块。
有类似如下报警信息
BUG: unable to handle kernel NULL pointer dereference at 0000000000000048 IP: [<ffffffffa0041c52>] hpsa_scsi_ioaccel_queue_command+0x32/0x7f0 [hpsa] RIP: 0010:[<ffffffffa0041c52>] [<ffffffffa0041c52>] hpsa_scsi_ioaccel_queue_command+0x32/0x7f0 [hpsa]在该段panic的信息中,我们可以看到有hpsa的字样。其中hpsa是Smart Array阵列卡的驱动模块。
如果用户使用系统集成的hpsa阵列卡驱动,或者hpsa驱动版本低于3.4.10,可能会触发这样的问题。
需要用户使用最新版本的驱动,如3.4.14以上版本的阵列卡hpsa驱动。
截止目前最新版本的驱动为3.4.18版本,可以从下面的链接中获取
http://downloads.linux.hpe.com/repo/spp/rhel/7Server/x86_64/2017.04.0/kmod-hpsa-3.4.18-105.rhel7u2.x86_64.rpm
或者下载最新版本的SPP,当前最新版本为SPP201704版本。
尽量按照操作系统后,尽早更新hpsa阵列卡的驱动,系统中集成的阵列卡驱动版本较低,有可能会出现各种异常现象。另外建议用户适当的降低hpsa获取状态的频率。
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作