R4900 G3
服务器系统下有内存报错
Aug 7 08:49:25 optimus20a10 kernel: EDAC MC1: 1 CE memory scrubbing error on CPU_SrcID#0_MC#1_Chan#0_DIMM#0 (channel:0 slot:0 page:0xecaf45 offset:0x140 grain:32 syndrome:0x0 - err_code:0008:00c0 socket:0 imc:1 rank:0 bg:3 ba:3 row:e94a col:140)
或
EDAC是服务器RAS(Reliability, Availability and Serviceability)在内存方面应用的一小部分。RAS是指通过一些技术手段,软硬件结合去保证服务器的这三个能力,内存CE错误是指计算机系统中的内存单元出现了校验错误(CE,Correctable Error),这意味着内存中的数据已经发生了错误,但是可以通过内存控制器或ECC技术进行自动纠正
4900 G3参照下面拓扑图,内存位置是按照H3C主板显示规则:
对系统EDAC记录的每根内存和物理机台内存丝印映射关系如下:
Linux系统下报错信息 |
内存位置 |
CPU_SrcID#0_MCO_chan#0_DIMM#0 |
CPU1-A1 |
CPU_SrcID#0_MCO_chan#0_DIMM#1 |
CPU1-A7 |
CPU_SrcID#0_MCO_chan#1_DIMM#0 |
CPU1-A2 |
CPU_SrcID#0_MCO_chan#1_DIMM#1 |
CPU1-A8 |
CPU_SrcID#0_MCO_chan#2_DIMM#0 |
CPU1-A3 |
CPU_SrcID#0_MCO_chan#2_DIMM#1 |
CPU1-A9 |
CPU_SrcID#0_MC1_chan#0_DIMM#0 |
CPU1-A4 |
CPU_SrcID#0_MC1_chan#0_DIMM#1 |
CPU1-A10 |
CPU_SrcID#0_MC1_chan#1_DIMM#0 |
CPU1-A5 |
CPU_SrcID#0_MC1_chan#1_DIMM#1 |
CPU1-A11 |
CPU_SrcID#0_MC1_chan#2_DIMM#0 |
CPU1-A6 |
CPU_SrcID#0_MC1_chan#2_DIMM#1 |
CPU1-A12 |
CPU_SrcID#1_MCO_chan#0_DIMM#0 |
CPU2-B1 |
CPU_SrcID#1_MCO_chan#0_DIMM#1 |
CPU2-B7 |
CPU_SrcID#1_MCO_chan#1_DIMM#0 |
CPU2-B2 |
CPU_SrcID#1_MCO_chan#1_DIMM#1 |
CPU2-B8 |
CPU_SrcID#1_MCO_chan#2_DIMM#0 |
CPU2-B3 |
CPU_SrcID#1_MCO_chan#2_DIMM#1 |
CPU2-B9 |
CPU_SrcID#1_MC1_chan#0_DIMM#0 |
CPU2-B4 |
CPU_SrcID#1_MC1_chan#0_DIMM#1 |
CPU2-B10 |
CPU_SrcID#1_MC1_chan#1_DIMM#0 |
CPU2-B5 |
CPU_SrcID#1_MC1_chan#1_DIMM#1 |
CPU2-B11 |
CPU_SrcID#1_MC1_chan#2_DIMM#0 |
CPU2-B6 |
CPU_SrcID#1_MC1_chan#2_DIMM#1 |
CPU2-B12 |
EDAC是系统有的一套内存校验和纠正的机制,当前CE报错已经被纠正不影响服务器正常运行,硬件报错的诊断依据是需要按照SDS日志的硬件诊断为主。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作