CloudOS E5132P02 新建GPU云主机界面上虚拟机状态直接变为异常,CAS无任务。
1、查看nova-compute日志,搜索uuid无日志记录,任务未到计算节点;
2、查看nova-scheduler日志,GpuFilter返回0,无可用的主机,检查虚拟化层资源情况;
3、查看CAS已新建对应的智能资源调度集群,且集群对应主机上GPU设备是启用状态;在CAS上直接新建虚拟机能正常绑定gpu资源,问题应该还是出在CloudOS上;
4、检查CloudOS上GPU云主机(分GPU和vGPU,根据虚拟化层类型选择)GPU类型规格是否与CAS上一致
对比以上两图发现,其中一个GPU设备CloudOS上类型名称不对。
另外,可以从CloudOS后台确认虚拟化层GPU信息,进入计算节点中,依次执行:
(1)source /root/admin-openrc.sh;
(2)nova hypervisor-list;
(3)nova hypervisor-show id(id号为上一步查询);
在CloudOS上新建GPU云主机单项规格,GPU类型为hypervisor-show显示名称,新建正常的规格后新建GPU云主机正常。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作