Print

HDM上报阵列卡LSI9460无响应问题处理

2025-03-24 发表

组网及说明

 

客户配置

HDM版本

6.12 V100R001B06D012SP01

BIOS版本

5.74 V100R001B05D091

CPLD版本

V00F

PFRCPLD版本

V00B

主板PCB版本

VER.A

Slot1

NIC-ETH-RP1000P2SFP-LP-2P

Slot2

NIC-ETH-SF400T-LP-4P-GE0x401

Slot3

RAID-LSI-9460-16i(4G)

Slot4

NIC-ETH-RP1000P2SFP-LP-2P

告警信息

机器HDM上报阵列卡无响应告警,带内使用正常,HDM告警内容如下图:

问题描述

机器HDM上报阵列卡无响应告警,带内使用正常

过程分析

分析为RP1000带外信息异常导致,不影响业务运行,阵列卡本身无异常。

解决方法

1.规避方案1

1、未上报告警的机台,发送IPMI命令,将两条阵列卡无响应告警日志级别降级到INFO级别

ipmitool -H X.X.X.X -I lanplus -U user -P password raw 0x36 0x09 0xa2 0x63 0x00 0x36 0x02 0x6f 0x28 0x04 0x00 0x00 0x00 0x01 0x04

ipmitool -H X.X.X.X -I lanplus -U user -P password raw 0x36 0x09 0xa2 0x63 0x00 0x36 0x02 0x6f 0x28 0x00 0x00 0x00 0x00 0x01 0x04

2.、已上报阵列卡无响应告警的机台,建议先重启主机,使告警恢复,并发送上述IPMI命令将告警日志级别降级到INFO级别。

2.规避方案2

如果彻底防止I2C8在出异常,HDM可以降级到3.51,此版本没有合入兼容RP1000MCTP I2C over lan信息读取

3.解决方案3:

由于是RP1000网卡的固件导致HDM读取I2C信息异常,导致I2C主进程异常,可以升级最新的RP1000 固件彻底解决此问题,计划25年4月份发布新的网卡固件