Print

R5500 G6搭配H20模组做SPECCPU压测失败

2024-11-07 发表

组网及说明

GCC版本8.5.0,推荐11.3.0

OS和内核版本

[root@localhost ~]# cat /etc/redhat-release

CentOS Linux release 8.2.2004 (Core) 

[root@localhost ~]# uname -r

4.18.0-193.6.3.el8_2.v1.6.x86_64

GPU驱动版本550.54.14

告警信息

 

 

问题描述

 R5500 G6+H20模组+Intel 8468V,SPECCPU压测时,1 copy正常,192 copies失败

 

过程分析

speedrate_int可以通过,跑rate_fp失败,调整散热模式无效,卸载GPU驱动后未复现问题,更换550.54.15版本的驱动后压测通过

解决方法

550.54.14版本的驱动在CPU压满的情况下,GPU驱动初始化不成功,会一直有nv_open_q进程占用CPU资源,且550.54.14版本的驱动H3C没有引入,不确定还会有哪些问题,550.54.15有引入,建议使用该版本

测试步骤参考: