• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

虚拟机持续运行时间

4天前提问
  • 0关注
  • 0收藏,59浏览
粉丝:1人 关注:0人

问题描述:

cas下的虚拟机,虚机所在cvk没有异常,节点下其他虚机正常,一台虚拟机也无人操作重启,但是虚拟机的持续运行时间很短。这是虚拟机运行异常导致的虚机操作系统发生了自动重启导致的吗?是不是只能通过虚拟机的系统运行日志去着手排查?

最佳答案

您好,可以看下操作日志,如果没有操作日志就只能进去虚拟机里看对应的系统日志

暂无评论

3 个回答
粉丝:0人 关注:0人

同CVK下其他虚机正常,大概率是该虚机本身操作系统异常,优先排查下异常虚机系统日志。

暂无评论

粉丝:16人 关注:1人

不一定。虽然虚拟机“持续运行时间很短”的现象确实很像是虚拟机内部操作系统重启所致,但你并不能仅凭这一点就直接断定是操作系统层面的问题。

尤其是在H3C CAS这类企业级虚拟化平台中,宿主机(CVK)的资源限制(如cgroup)或高可用(HA)等机制,都有可能成为“误杀”或重启虚拟机的“真凶”。排查时需要结合CAS平台和虚拟机内部两个维度的日志进行综合分析。


 分三步,排查重启真相

你可以按照“由外到内”的顺序,从CAS平台逐步深入到虚拟机内部来排查:

第一步:从CAS管理平台入手,看宏观原因

  • CAS管理界面是排查工作的起点。你可以先登录CAS管理界面,在左侧“虚拟化”选项卡中右键点击出问题的虚拟机,选择“日志管理”并切换到“操作记录”选项卡,通过搜索“重启”或“故障”来查找线索。

  • 同时,结合以下两个关键的宿主机日志进行判断

    • cvm_ha.log中出现HA重启记录:如果日志中出现title="[虚拟机名称]"等信息,意为HA记录了一次对这台虚拟机的重启尝试-1。这通常意味着是CAS平台的HA功能,因检测到存储访问问题等故障而主动发起的重启,问题根源可能在平台或存储上。

    • /var/log/messages中出现oom-kill记录:如果在虚拟机重启的时间点,宿主机系统日志中存在Memory cgroup out of memory这类记录,表明宿主机的cgroup监控到该虚拟机内存使用超标,被系统强制“杀掉”(Kill)了。这通常是由于虚拟机内存配置不足或内部应用内存溢出导致。

第二步:深入CVK宿主机排查

无论在上一步是否发现了异常,都需要执行以下两条命令来确认宿主机本身及虚拟机运行时的状态:

  1. last reboot确认宿主机没有重启过:为避免无效排查,首先要确认虚拟机重启发生的时间段内,其所在的宿主机未曾重启。

  2. 检查QEMU日志,判断重启源于内部崩溃还是外部干预
    通过SSH登录到CVK宿主机后台,执行命令 cat /var/log/libvirt/qemu/<问题虚拟机名称>.log 查看QEMU日志。

    • 寻找“shutting down, reason=crashed”:如果日志中存在此行,说明是虚拟机操作系统内部发生崩溃(crash)导致了重启。这时,排查重点就应转向第三步的虚拟机内部。

    • 如果日志为空或显示正常关闭:则说明重启很可能是由外部(如HA、cgroup、用户误操作等)触发的。

第三步:在虚拟机内部寻找线索

如果第二步的QEMU日志明确指向虚拟机内部崩溃,则需要进入操作系统内部进行排查:

  • Windows系统:重点查看事件查看器。在“Windows日志”->“系统”下,重点关注事件ID 41(Kernel-Power)、6008(意外关机)和1074(用户发起重启)等记录。

  • Linux系统:通过journalctl -b -1 --no-pager | tail -n 100 命令查看上一次启动的系统日志,寻找errorpanicOOM等关键词;或通过last -x 命令查看系统的重启和关机历史,以确认具体的重启时间点。

暂无评论

粉丝:10人 关注:2人

先给你结论

  1. CVK 主机正常、同节点其他虚机都稳,单台虚机频繁重置、运行时长很短
    99% 就是这台虚拟机自身主动重启 / 崩溃,不是底层 CVK 硬件和集群问题
  2. 不只是看虚拟机系统日志,要分三层排查:CAS 平台日志 → CVK 宿主机日志 → 虚拟机系统日志,三层缺一不可。
  3. 无人手动操作、没人为重启,虚机变短时间在线,常见就这几类原因:

一、为什么持续运行时间很短、自动重启

1)虚拟机操作系统自身崩溃 / 蓝屏 / 内核 panic

Windows 蓝屏自动重启、Linux 内核崩溃、OOM 内存溢出,系统直接自动重启。
表现:平台看虚机瞬间重启,CVK 无告警,其他虚机全正常。

2)CAS 平台 / 虚拟机配置触发自动重置

  • 配置了虚拟机高可用 HA、故障自动重启
  • 虚拟机资源阈值告警(CPU / 内存负载卡死)触发平台自愈重启
  • 快照链异常、磁盘镜像损坏,IO 卡死后平台拉起重启

3)虚拟机内存、磁盘镜像文件损坏

单个虚机磁盘增量镜像有坏块、qcow2 镜像异常,IO 超时被 CAS 判定故障,自动重启实例。

4)虚拟机内部业务死锁、守护进程强制重启系统

里面装的应用 / 守护脚本卡死,内部脚本自动 reboot,外人看不出操作痕迹。

二、排查顺序(按优先级,不用瞎找)

第一层:先看 CAS 平台侧(最快定位是不是平台触发重启)

  1. 虚拟机 → 监控 / 日志 → 事件日志、操作日志、告警日志
    看有没有:
  • 虚拟机 HA 触发重启
  • 资源过载故障重启
  • 存储 IO 超时、磁盘异常重启
  1. 查看虚拟机运行状态变化记录
    看重启时刻,是不是平台主动调度重启,还是虚机自己宕机后自启。

第二层:看 CVK 宿主机日志

CVK 本身正常不代表对单台虚机无异常:
登录 CVK 后台,看虚拟机进程、libvirt、qemu 日志
有没有:
  • qemu 进程异常退出
  • 虚拟网卡 / 虚拟磁盘 IO 报错
    这一层能区分:是底层进程崩了,还是系统自己崩

第三层:才是进虚拟机看系统日志

Windows

  • 事件查看器 → Windows 日志 → 系统
    事件 ID 6005、6006、41
    Event ID 41 Kernel-Power 就是:系统意外断电 / 蓝屏 / 内核崩溃自动重启。

Linux

bash
运行
last -x | grep reboot dmesg -T cat /var/log/messages
看 OOM、kernel panic、硬件报错。

三、关键判断一句话

  • 平台日志有 HA / 故障重启记录 → CAS 层触发
  • CVK qemu 进程异常退出 → 虚拟化层镜像 / 进程问题
  • 平台和 CVK 都无任何重启触发记录纯虚拟机操作系统自身崩溃 / 内部脚本重启,必须看系统日志。

四、临时规避建议

  1. 先关闭该虚拟机 HA 自动重启,避免反复崩
  2. 检查虚拟机磁盘快照链,有多余多级镜像就合并磁盘镜像
  3. 调整内存 / CPU 资源,不要超配
  4. 关闭 Windows “系统失败时自动重新启动”,先抓到蓝屏代码

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明