问

虚拟机持续运行时间

虚拟机

2026-05-09提问

0关注
0收藏，445浏览

喂人民服雾

喂人民服雾四段

粉丝：1人关注：0人

问题描述：

cas下的虚拟机，虚机所在cvk没有异常，节点下其他虚机正常，一台虚拟机也无人操作重启，但是虚拟机的持续运行时间很短。这是虚拟机运行异常导致的虚机操作系统发生了自动重启导致的吗？是不是只能通过虚拟机的系统运行日志去着手排查？

最佳答案

听见你说达不溜

听见你说达不溜九段

粉丝：97人关注：0人

您好，可以看下操作日志，如果没有操作日志就只能进去虚拟机里看对应的系统日志

暂无评论

3 个回答

按时间按赞数

物质空间位置转移

物质空间位置转移七段

粉丝：0人关注：0人

同CVK下其他虚机正常，大概率是该虚机本身操作系统异常，优先排查下异常虚机系统日志。

暂无评论

刘浩存

刘浩存九段

粉丝：26人关注：1人

不一定。虽然虚拟机“持续运行时间很短”的现象确实很像是虚拟机内部操作系统重启所致，但你并不能仅凭这一点就直接断定是操作系统层面的问题。

尤其是在H3C CAS这类企业级虚拟化平台中，宿主机（CVK）的资源限制（如cgroup）或高可用（HA）等机制，都有可能成为“误杀”或重启虚拟机的“真凶”。排查时需要结合CAS平台和虚拟机内部两个维度的日志进行综合分析。

分三步，排查重启真相

你可以按照“由外到内”的顺序，从CAS平台逐步深入到虚拟机内部来排查：

第一步：从CAS管理平台入手，看宏观原因

CAS管理界面是排查工作的起点。你可以先登录CAS管理界面，在左侧“虚拟化”选项卡中右键点击出问题的虚拟机，选择“日志管理”并切换到“操作记录”选项卡，通过搜索“重启”或“故障”来查找线索。
同时，结合以下两个关键的宿主机日志进行判断：
- 若cvm_ha.log中出现HA重启记录：如果日志中出现title="[虚拟机名称]"等信息，意为HA记录了一次对这台虚拟机的重启尝试-1。这通常意味着是CAS平台的HA功能，因检测到存储访问问题等故障而主动发起的重启，问题根源可能在平台或存储上。
- 若/var/log/messages中出现oom-kill记录：如果在虚拟机重启的时间点，宿主机系统日志中存在Memory cgroup out of memory这类记录，表明宿主机的cgroup监控到该虚拟机内存使用超标，被系统强制“杀掉”（Kill）了。这通常是由于虚拟机内存配置不足或内部应用内存溢出导致。

第二步：深入CVK宿主机排查

无论在上一步是否发现了异常，都需要执行以下两条命令来确认宿主机本身及虚拟机运行时的状态：

用last reboot确认宿主机没有重启过：为避免无效排查，首先要确认虚拟机重启发生的时间段内，其所在的宿主机未曾重启。
检查QEMU日志，判断重启源于内部崩溃还是外部干预：
通过SSH登录到CVK宿主机后台，执行命令 cat /var/log/libvirt/qemu/<问题虚拟机名称>.log 查看QEMU日志。
- 寻找“shutting down, reason=crashed”：如果日志中存在此行，说明是虚拟机操作系统内部发生崩溃（crash）导致了重启。这时，排查重点就应转向第三步的虚拟机内部。
- 如果日志为空或显示正常关闭：则说明重启很可能是由外部（如HA、cgroup、用户误操作等）触发的。

第三步：在虚拟机内部寻找线索

如果第二步的QEMU日志明确指向虚拟机内部崩溃，则需要进入操作系统内部进行排查：

Windows系统：重点查看事件查看器。在“Windows日志”->“系统”下，重点关注事件ID 41（Kernel-Power）、6008（意外关机）和1074（用户发起重启）等记录。
Linux系统：通过journalctl -b -1 --no-pager | tail -n 100 命令查看上一次启动的系统日志，寻找error、panic、OOM等关键词；或通过last -x 命令查看系统的重启和关机历史，以确认具体的重启时间点。

暂无评论

zhiliao_GeOM0O

zhiliao_GeOM0O 九段

粉丝：23人关注：2人

先给你结论

CVK 主机正常、同节点其他虚机都稳，单台虚机频繁重置、运行时长很短
99% 就是这台虚拟机自身主动重启 / 崩溃，不是底层 CVK 硬件和集群问题。
不只是看虚拟机系统日志，要分三层排查：CAS 平台日志 → CVK 宿主机日志 → 虚拟机系统日志，三层缺一不可。
无人手动操作、没人为重启，虚机变短时间在线，常见就这几类原因：

一、为什么持续运行时间很短、自动重启

1）虚拟机操作系统自身崩溃 / 蓝屏 / 内核 panic

Windows 蓝屏自动重启、Linux 内核崩溃、OOM 内存溢出，系统直接自动重启。

表现：平台看虚机瞬间重启，CVK 无告警，其他虚机全正常。

2）CAS 平台 / 虚拟机配置触发自动重置

配置了虚拟机高可用 HA、故障自动重启
虚拟机资源阈值告警（CPU / 内存负载卡死）触发平台自愈重启
快照链异常、磁盘镜像损坏，IO 卡死后平台拉起重启

3）虚拟机内存、磁盘镜像文件损坏

单个虚机磁盘增量镜像有坏块、qcow2 镜像异常，IO 超时被 CAS 判定故障，自动重启实例。

4）虚拟机内部业务死锁、守护进程强制重启系统

里面装的应用 / 守护脚本卡死，内部脚本自动 reboot，外人看不出操作痕迹。

二、排查顺序（按优先级，不用瞎找）

第一层：先看 CAS 平台侧（最快定位是不是平台触发重启）

虚拟机 → 监控 / 日志 → 事件日志、操作日志、告警日志
看有没有：

虚拟机 HA 触发重启
资源过载故障重启
存储 IO 超时、磁盘异常重启

查看虚拟机运行状态变化记录
看重启时刻，是不是平台主动调度重启，还是虚机自己宕机后自启。

第二层：看 CVK 宿主机日志

CVK 本身正常不代表对单台虚机无异常：

有没有：

qemu 进程异常退出
虚拟网卡 / 虚拟磁盘 IO 报错
这一层能区分：是底层进程崩了，还是系统自己崩。

第三层：才是进虚拟机看系统日志

Windows

事件查看器 → Windows 日志 → 系统
找事件 ID 6005、6006、41
Event ID 41 Kernel-Power 就是：系统意外断电 / 蓝屏 / 内核崩溃自动重启。

Linux

bash

运行

last -x | grep reboot
dmesg -T
cat /var/log/messages

看 OOM、kernel panic、硬件报错。

三、关键判断一句话

平台日志有 HA / 故障重启记录 → CAS 层触发
CVK qemu 进程异常退出 → 虚拟化层镜像 / 进程问题
平台和 CVK 都无任何重启触发记录 → 纯虚拟机操作系统自身崩溃 / 内部脚本重启，必须看系统日志。

四、临时规避建议

先关闭该虚拟机 HA 自动重启，避免反复崩
检查虚拟机磁盘快照链，有多余多级镜像就合并磁盘镜像
调整内存 / CPU 资源，不要超配
关闭 Windows “系统失败时自动重新启动”，先抓到蓝屏代码

暂无评论

编辑答案

分享扩散:

➤

网站相关: 关于我们; 服务条款; 隐私政策; 帮助中心; 经验与权限; 积分规则

联系我们: 联系我们; 建议反馈

常用链接: 标杆的神器下载

关注我们: H3C官网; 新华三服务公众号; 安仔远程运维服务; 新华三商城

内容许可: 除特别说明外，用户内容均可采用知识共享署名-相同方式共享3.0中国大陆许可协议进行许可

本图标版权归新华三集团所有，仅限本社区使用，切勿用做商业目的，违者必究

浙ICP备09064986号-1 浙公网安备 33010802004416号

✖

亲~登录后才可以操作哦!

确定

✖

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

✖

你的邮箱还未认证，请认证邮箱或绑定手机后进行当前操作

✖

侵犯我的权益 >

对根叔社区有害的内容 >

辱骂、歧视、挑衅等（不友善）

侵犯我的权益

泄露了我的隐私 >

侵犯了我企业的权益 >

抄袭了我的内容 >

诽谤我 >

辱骂、歧视、挑衅等（不友善）

骚扰我

泄露了我的隐私

您好，当您发现根叔知了上有泄漏您隐私的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您认为哪些内容泄露了您的隐私？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

侵犯了我企业的权益

您好，当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱，我们会在审核后尽快给您答复。

1. 您举报的内容是什么？（请在邮件中列出您举报的内容和链接地址）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）
3. 是哪家企业？（营业执照，单位登记证明等证件）
4. 您与该企业的关系是？（您是企业法人或被授权人，需提供企业委托授权书）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

原文链接或出处

诽谤我

您好，当您发现根叔知了上有诽谤您的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您举报的内容以及侵犯了您什么权益？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

垃圾广告信息

色情、暴力、血腥等违反法律法规的内容

政治敏感

不规范转载 >

辱骂、歧视、挑衅等（不友善）

骚扰我

诱导投票

不规范转载

举报说明

产品线		搜索取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式	默认策略匹配全词匹配整句

虚拟机持续运行时间

问题描述：

分三步，排查重启真相

先给你结论

一、为什么持续运行时间很短、自动重启

1）虚拟机操作系统自身崩溃 / 蓝屏 / 内核 panic

2）CAS 平台 / 虚拟机配置触发自动重置

3）虚拟机内存、磁盘镜像文件损坏

4）虚拟机内部业务死锁、守护进程强制重启系统

二、排查顺序（按优先级，不用瞎找）

第一层：先看 CAS 平台侧（最快定位是不是平台触发重启）

第二层：看 CVK 宿主机日志

第三层：才是进虚拟机看系统日志

Windows

Linux

三、关键判断一句话

四、临时规避建议

编辑答案

提出建议