问

紫鸾虚机报错

启动

2026-04-14提问

0关注
0收藏，580浏览

1371177895

1371177895 二段

粉丝：0人关注：0人

问题描述：

Failed to create pod sandbox: rpc error: code = Unknown desc = failed to reserve sandbox name "virt-launcher-i-h67utdnx-r42nn_vm-c7f42d50_93fe43d0-ac45-4bd9-ad44-13a4e85c578b_0": name "virt-launcher-i-h67utdnx-r42nn_vm-c7f42d50_93fe43d0-ac45-4bd9-ad44-13a4e85c578b_0" is reserved for "94a5243cdcf0b02c672059b0513388aec361c2bb4b1e79069a76fbd35ad4"

Failed to create pod sandbox: rpc error: code = DeadlineExceeded desc = context deadline exceeded

2 个回答

按时间按赞数

zhiliao_Gixe

zhiliao_Gixe 八段

粉丝：13人关注：9人

### 故障根因
虚机销毁时资源残留，containerd中已存在同名virt-launcher容器的名称预留条目，导致新pod创建冲突。
### 排查处理步骤
1. 清理K8s残留pod：

kubectl get pods -A | grep virt-launcher-i-h67utdnx-r42nn
# 若存在异常/terminating状态残留，执行强制删除
kubectl delete pod <残留pod名> -n <对应namespace> --force --grace-period=0

2. 清理containerd残留资源：

# 查残留容器
crictl ps -a | grep i-h67utdnx-r42nn
# 删残留容器
crictl rm <对应容器ID>
# 强制清理同名预留条目
crictl rm --name "virt-launcher-i-h67utdnx-r42nn_vm-c7f42d50_93fe43d0-ac45-4bd9-ad44-13a4e85c578b_0"

3. 操作完成后重新触发虚机启动即可。
⚠️ 注意：操作前确认对应虚机已停用，避免误删业务资源。

暂无评论

刘浩存

刘浩存九段

粉丝：27人关注：1人

这个报错的核心原因是：由于节点负载过高或I/O性能问题，容器运行时（CRI-O）在Kubelet设定的时间内没有完成操作，导致任务超时，最终产生了“沙箱名称被占用”的错误提示。

简单来说，流程是这样的：

你下达指令要创建一个虚拟机。
Kubernetes会创建一个对应的virt-launcher Pod。
该Pod被调度到某个节点，然后Kubelet会要求CRI-O为这个Pod创建一个沙箱（Sandbox）。
如果此时节点本身负载很高，或者因为挂载了很大的数据卷导致磁盘I/O成为瓶颈，CRI-O处理这个请求的时间就会非常长，最终超过了默认的时间限制（DeadlineExceeded）。
超时后，Kubelet会重试。但CRI-O这边，之前的操作可能还没有彻底清理干净，导致系统认为那个沙箱的名字仍然“被占用”，从而报出“name is reserved”的错误。

因此，这通常不是一个程序bug，而是一个资源瓶颈引发的连锁反应。

🎯 解决步骤

建议按以下顺序进行排查和操作，核心思路是降低节点压力，同时清理当前卡住的任务：

📝 第一步：初步排查与清理
- 首先，尝试直接删除当前卡住的虚拟机对象。但仅删除对象可能不会自动清理底层的Pod和容器。
- 你需要通过Kubernetes命令行工具，强制删除掉失败的virt-launcher-* Pod。
  kubectl delete pod <virt-launcher-pod-name> -n <namespace> --force --grace-period=0 这样做是为了强制终止并清理掉那个“失联”的任务，为重新创建铺路。
🩺 第二步：诊断节点健康状况
这是最关键的一步，目的是找到根本原因。登录到你的“紫鸾”平台，或者直接登录到该虚拟机所在节点的后台，检查以下项目：
- 节点整体负载：运行top或htop命令，检查CPU和内存使用率是否很高。如果节点负载很高，其他任务自然会超时。
- 磁盘I/O性能：这是最可能的原因。运行iostat -x 1（需要安装sysstat包），重点关注 %util（设备繁忙程度）和 await（平均I/O请求耗时）这两列。如果 %util 持续接近100%，或者 await 数值很大（超过几十毫秒），说明磁盘是瓶颈。
- 检查具体进程：查找可能占用大量I/O的进程。
  # 查看当前占用I/O较高的进程
  iotop -o # 或者查看系统平均负载 uptime
⚙️ 第三步：根本解决与后续建议
根据上一步的检查结果，选择对应的解决方案：
- 如果问题是节点负载过高：最佳实践是为这个虚拟机所在的命名空间（Namespace）配置资源配额（ResourceQuota）。这可以限制该命名空间下所有Pod能使用的总资源（CPU和内存），防止某个应用过度消耗资源，影响整个节点的稳定性。
- 如果问题是磁盘I/O瓶颈：这是根本原因。可以考虑为虚拟机数据卷使用性能更高的存储类型（例如使用全闪存阵列或本地NVMe SSD），或者确认存储系统本身是否健康。如果存储设备有抖动，节点上的所有I/O操作都会被拖慢。
- 考虑节点维护：如果单个节点问题严重，你可以将这个节点标记为不可调度（cordon），并将上面的Pod驱逐出去（drain），然后重启节点进行维护。
- 清理未使用的镜像：如果节点磁盘空间紧张，可以清理CRI-O中不再使用的镜像来释放一些空间。
  # 清理所有未使用的镜像
  crictl rmi --prune

暂无评论

编辑答案

分享扩散:

➤

网站相关: 关于我们; 服务条款; 隐私政策; 帮助中心; 经验与权限; 积分规则

联系我们: 联系我们; 建议反馈

常用链接: 标杆的神器下载

关注我们: H3C官网; 新华三服务公众号; 安仔远程运维服务; 新华三商城

内容许可: 除特别说明外，用户内容均可采用知识共享署名-相同方式共享3.0中国大陆许可协议进行许可

本图标版权归新华三集团所有，仅限本社区使用，切勿用做商业目的，违者必究

浙ICP备09064986号-1 浙公网安备 33010802004416号

✖

亲~登录后才可以操作哦!

确定

✖

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

✖

你的邮箱还未认证，请认证邮箱或绑定手机后进行当前操作

✖

侵犯我的权益 >

对根叔社区有害的内容 >

辱骂、歧视、挑衅等（不友善）

侵犯我的权益

泄露了我的隐私 >

侵犯了我企业的权益 >

抄袭了我的内容 >

诽谤我 >

辱骂、歧视、挑衅等（不友善）

骚扰我

泄露了我的隐私

您好，当您发现根叔知了上有泄漏您隐私的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您认为哪些内容泄露了您的隐私？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

侵犯了我企业的权益

您好，当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱，我们会在审核后尽快给您答复。

1. 您举报的内容是什么？（请在邮件中列出您举报的内容和链接地址）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）
3. 是哪家企业？（营业执照，单位登记证明等证件）
4. 您与该企业的关系是？（您是企业法人或被授权人，需提供企业委托授权书）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

原文链接或出处

诽谤我

您好，当您发现根叔知了上有诽谤您的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您举报的内容以及侵犯了您什么权益？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

垃圾广告信息

色情、暴力、血腥等违反法律法规的内容

政治敏感

不规范转载 >

辱骂、歧视、挑衅等（不友善）

骚扰我

诱导投票

不规范转载

举报说明

产品线		搜索取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式	默认策略匹配全词匹配整句

紫鸾虚机报错

问题描述：

🎯 解决步骤

编辑答案

提出建议