• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

CAS虚拟机使用Nvidia GPU卡直通时,建议在虚拟机内部关闭MSI中断

2021-02-07 发表
  • 0关注
  • 2收藏 2881浏览
粉丝:34人 关注:5人

组网及说明


问题描述

部分局点的CAS虚拟机使用Nvidia GPU卡直通时,该虚拟机所在的CVK概率性发生重启。

过程分析

1、CAS日志并无异常打印。

2、硬件侧无明显异常。

3、经 Nvidia 侧分析,该问题为 GPU开启msi/msi-x会有概率踩未做内存映射的区域导致发生不可纠正错误,进而造成host OS重启。

即GPU未关闭MSI,概率性导致内存越界问题,最终触发宿主机重启。

解决方法

建议在虚拟机内部关闭MSI中断,防止该问题发生。(注意:需要业务侧评估虚拟机内部关闭MSI对业务侧的影响。)

具体操作如下:

1.    Centos 7.2系统

1.1查看GPU MSI中断
1.1.1查询GPU pci

Cvk上执行命令,查询pci设备号。如:0000:00:0a.0

~# lcpci –D –d 10de:


1.1.2查看GPU MSI/MSI-X中断状态

Lspci命令查看pci配置空间。

~# lcpci –vvvv –s 0000:00:0a.0 |egrep “MSI|MSI-X” |grep –i Enable

开始状态:Enable+

关闭状态:Enalbe-


1.2关闭MSI中断

grub启动参数中增加”pci=nomsi”

~# vim /etc/default/grub


1.2.1传统模式BIOS系统

         更新grub.cfg文件

~# grub2-mkconfig –o /boot/grub2/grub.cfg


1.2.2 UEFI模式BIOS系统

~# grub2-mkconfig –o /boot/efi/EFI/centos/grub.cfg

1.2.3重启虚拟机

         ~# reboot

         ~# cat /proc/cmdline   #有“pci=nomsi”字符串配置成功。


window 2012 r2系统

2.1查看GPU MSI状态

l  Cmd命令行执行“regedit”打开注册表;


l  找到PCI设备目录表,【HKEY_LOCAL_MACHINE->SYSTEM->CurrentControlSet->Enum->PCI


l  NVIDIA厂商vendor ID 10deGPU卡(以T4卡为例)device ID 1eb8,对应PCI设备是以“VEN_10DE&DEV_1EB8”开头;


l  查看GPU卡的MSI注册表MSISupported数据值。【3&..->Device Parameters->Interrupt Mannagement->MessageSignaledInterruptProperties->MSISupported

开启:0x1

关闭:0x0

\

2.2关闭MSI

l  双击【MSISupported】,修改数值数据为0.

         

l  重启虚拟机

该案例对您是否有帮助:

您的评价:1

若您有关于案例的建议,请反馈:

1 个评论
粉丝:34人 关注:5人

在CAS E0721及以后版本里,vfio驱动已经更新,解决该问题。因此在E0721及以后版本,可以不用关闭MSI 。

编辑评论

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作