A800压测失败上报0000140 nvlink error,已经更换过底板、sw、中板、线缆、单卡后压测依旧有000000000140 (NvLink bus error)的报错, Fieldiag工具最新版本3.119,且已经改过底板信息。

nvidia给出该报错与底板有关,后需再次更换底板故障依旧,现场交叉测试,将其他服务器模组安装在故障服务器测试通过,最终通过更换底板和8GPU后问题解决。
更换底板和8GPU后问题解决。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作