
1块T4 加入资源池 给1台机器,保存之后开机就提示那个 删掉GPU就可以启动 如何解决
提示 启动虚拟机“AI服务器”失败。原因:主机IOMMU/SMMU没有启用,开启IOMMU/SMMU后重试。
(0)
cvknode)上执行以下操作。cvknode主机。Del, F2, F12等)进入 BIOS/UEFI 设置界面。Enabled:注意:不同品牌的主机(如Dell、HP、华为、浪潮)的BIOS界面差异很大,这些选项可能位于Advanced(高级)、Processor(处理器)或Security(安全)等菜单下。请根据您的主机型号查阅相关资料。
cvknode主机,或直接在控制台上操作。/etc/default/grub。vi /etc/default/grubGRUB_CMDLINE_LINUX开头的行。在引号 ""内的现有参数后面,添加以下参数:intel_iommu=on iommu=ptamd_iommu=on iommu=ptGRUB_CMDLINE_LINUX="...原有参数... intel_iommu=on iommu=pt"intel_iommu=on/ amd_iommu=on:启用IOMMU。iommu=pt:pt代表 "Pass-Through",表示仅为需要直通的设备启用IOMMU,这样可以减少性能开销。grub2-mkconfig -o /boot/grub2/grub.cfgrebootcvknode。cat /proc/cmdline | grep iommuintel_iommu=on和 iommu=pt等参数。ls /sys/kernel/iommu_groups/0, 1, 2...),而不是空目录。find /sys/kernel/iommu_groups/ -name 0000:8a:00.00000:8a:00.0替换为您的T4显卡的设备ID(您在CAS界面中可以看到)。此命令会返回该设备所在的IOMMU组路径。nvidia-smi)看到这块T4显卡。| 步骤 | 操作位置 | 核心操作 | 目的 |
|---|---|---|---|
| 1 | 主机BIOS/UEFI | 开启 Intel VT-d/ AMD-Vi | 启用硬件的直接I/O虚拟化功能 |
| 2 | CVK主机系统 | 修改GRUB,添加 iommu=on参数 | 在操作系统中激活IOMMU驱动 |
| 3 | CVK主机系统 | 重启并验证 /proc/cmdline和 IOMMU组 | 确认配置已生效且设备准备就绪 |
| 4 | CAS管理平台 | 重新为虚拟机添加GPU并开机 | 完成GPU直通 |
/var/log/messages)以获取更多线索。(0)
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论