Print

cloudos2.0下发虚拟机异常的一种排查 思路

组网及说明

不涉及组网

问题描述

某局点cloudos2.0下发虚拟机异常。如下图



过程分析

1、看cas上并没有收到os的任务,用替他镜像下发是能成功的,起初怀疑是制作的镜像有问题。

2、重新按照os镜像制作文档制作之后,下发还是提示异常,因此感觉并非是镜像的问题。

3、进入openstack-comput容器,查看/var/log/nova/nova-comput.log日志,已异常的虚拟机的uuid为关键字搜索,发现有空间不足的提示,如下图。


解决方法

根据日志中的提示,查看cvk,并没有发现cvk计算资源紧张,结合 之前问题现象,用已有的镜像下发虚拟机可以,用新建的镜像下发虚拟异常,因此怀疑,对应的cas的cvm的/vms被占满。因为在os首次使用某个下发虚拟机的时候,会将镜像文件拷贝一份到/vms/nova 目录下,已有的镜像就不会再进行拷贝,这样设计是为了加快重复使用同一镜像下发虚拟机的效率。本着该思路,df -h查看cvm后台,发现/vms果然被占满。

释放了/vms/nova 目录下的空间,再次下发虚拟机,发现cas接收到了os的命令并从拷贝镜像开始,创建虚拟机成功。