Print

HUAWEI 2288H v5服务器出现“可用的预留 NAND Flash 块数量小于阀值(10%)”告警!

告警信息

1. 服务器前面板健康灯红灯报警。

2. iBMC里出现“The value of Reserved Block recorded is less than 10%”的警告信息.

问题描述

按照华为官方建议,将iBMC版本升级到V392。

升级完成后,iBMC管理地址无法ping通,无法再次登录iBMC管理页面

仔细查看官方文档后,确认由于剩余可用空闲块严重不足导致升级失败。

最终更换主板解决。

过程分析

  1. iBMC上报了“The remaining reserved blocks of the NAND flash are less than 10%.”告警

  2. iBMC一键收集日志的dump_infoAppDumpiBMCnandflash_info.txt日志中记录Reserved Block的值低于10%

 

旧版本有以下几种情况:

1.日志里记录剩余预留块数量>0%时,实际预留块数目>50%,还能够正常使用iBMC较长时间,也可直接升级到iBMC 3.81及以上版本,升级后收集一键收集日志,在nandflash_info.txt日志里查看剩余预留块真实数目。

2.日志里记录剩余预留块数量=0%时,实际预留块数目≤50%,收集一键收集日志,有以下几种情况:

a)一键收集日志出现乱码(例如黑底NUL等),或者从某一时间后没有再记录日志,说明实际预留块数目是真的不足,需要更换主板。

b)一键收集日志正常,则实际预留块数目可能足够也可能不足。如需确认实际预留块真实数目,可以升级到iBMC 3.81及以上版本,升级后收集一键收集日志,在nandflash_info.txt日志里查看剩余预留块真实数目。

c)如果升级iBMC异常失败,或升级成功但升级完成后iBMC主备区版本仍是老版本,说明预留块是真的不足,需要更换主板。

 

如果产生Nandflash剩余预留块不足告警后,过一段时间iBMC出现功能异常(例如收集日志失败、收集日志成功但日志出现乱码、WEB或SSH无法访问、升级失败、升级成功但实际版本没有刷新等现象),则可能是剩余预留块低于6块,NandFlash进入只读模式,iBMC功能异常。这种情况下需要更换主板。

解决方法

1、出现“The value of Reserved Block recorded is less than 10%”的警告信息时,先使用一键收集功能收集日志,在日志中确认真实的剩余预留块真实数目

2、尽早将相应服务器的iBMC版本升级到推荐版本