• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

R5300 G5 部署大模型的时候同时使用两张及以上A10卡会卡住,使用一张A10则正常

2025-05-12提问
  • 0关注
  • 0收藏,617浏览
粉丝:0人 关注:0人

问题描述:

 

 

R5300 G5 部署大模型的时候同时使用两张及以上A10卡会卡住,使用一张A10则正常

 

 

 

1 个回答
粉丝:19人 关注:0人

R5300 G5服务器在多GPU场景下可能存在的配置问题及解决方案如下:

1. BIOS参数调整

  • 问题:当多GPU卡部署时,BIOS中的SRIOVSupport参数若为Disabled可能导致驱动加载异常或资源分配冲突。
  • 解决
    进入BIOS设置,将SRIOVSupport设置为Enabled,确保虚拟化功能支持多GPU资源分配。

2. NVLink配置检查

  • 问题:若使用NVLink桥接模块提升多卡通信性能,需严格按照安装准则配置。若未正确安装相邻槽位的三个NVLink Bridge模块,可能导致通信异常。
  • 解决
    检查GPU卡安装槽位是否为推荐的相邻槽位(如slot7-slot8、slot9-slot10等),确保每个相邻GPU对之间同时选配三个NVLink Bridge模块。

3. 电源与线缆验证

  • 问题:多GPU卡功耗较高,若电源模块功率不足或GPU电源线缆未正确连接,可能导致供电不稳定。
  • 解决
    • 确认服务器电源模块总功率满足所有GPU卡的总功耗需求(单张A10卡功率≥250W)。
    • 检查每张GPU卡的电源线缆是否连接牢固,使用原厂或兼容线缆。

4. 驱动与固件版本升级

  • 问题:旧版驱动或BIOS可能存在多GPU兼容性问题。
  • 解决
    • 更新NVIDIA GPU驱动至最新版本。
    • 升级服务器BIOS至支持多GPU配置的最新版本(如案例中提到的5.27版本修复槽位映射问题)。

5. PCIe槽位与Riser卡兼容性

  • 问题:错误的PCIe槽位配置或Riser卡扩展模块未适配可能导致带宽冲突。
  • 解决
    参考用户指南中的GPU安装顺序(如slot7-slot14顺序),避免交叉安装。确保Riser卡支持多GPU的物理布局和散热条件。

6. 日志收集与进一步排查

  • 若上述步骤无效,需收集以下信息:
    • HDM SDS日志(含硬件状态及告警)。
    • nvidia-bug-report输出。
    • 操作系统日志(如dmesgjournalctl)。
  • 联系技术支持,排查硬件故障(如GPU卡、主板插槽或电源模块异常)。

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明