• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

UIS+虚拟机暂停

10小时前提问
  • 0关注
  • 0收藏,42浏览
粉丝:0人 关注:0人

问题描述:

在主机下显示可以容量为0,导致部分虚拟机暂停

同一集群下,一些主机存储显示还有可用空间

2 个回答
粉丝:34人 关注:1人

只能扩容了,或者看看这个共享文件系统下有没有无使用者的,先删掉腾出来一部分功能,先恢复业务

等业务恢复了之后再去迁移到其他存储上,共享存储卷空间满了,该卷下的所有虚拟机均会处于暂停状态

暂无评论

粉丝:15人 关注:0人

问题的关键在于 第一张图片​ 中名为 DATA03_HDD_20T​ 的共享文件系统,其 可用容量明确显示为 0.00MB
  1. 直接原因:当某个数据存储(Datastore)的可用空间为0时,依赖该存储运行的虚拟机将无法创建新的文件或写入数据(例如,扩展虚拟磁盘、创建快照、写入日志等),虚拟化平台为了保护数据安全和系统稳定,会自动将这些虚拟机置于“暂停”状态。
  2. 矛盾点与关键信息:您提到“同一集群下,一些主机存储显示还有可用空间”。这通过第二张图片得到了印证,该图片显示 DATA03_HDD_20T的可用容量为 1.03TB
    • 可能性分析:这种显示不一致通常有以下几种原因:
      • 缓存或界面刷新延迟:第一张图可能是某个管理节点上未及时刷新的旧数据。
      • 不同主机的视角:在集群环境中,可能由于网络瞬时问题或存储多路径配置,导致某个主机无法正确识别存储的实际剩余空间,从而报告为0。
      • 存储自身快照或元数据占用:存储设备本身可能存在未在虚拟化层完全体现的占用(如快照、孤儿文件等),导致从平台内部看空间已满,但从另一个查询角度看仍有空间。
尽管存在显示不一致的情况,但虚拟机暂停是确凿发生的故障,我们必须以最坏情况(即空间已满)为首要处理原则。

解决方案与步骤建议

请按照以下优先级顺序进行操作,以尽快恢复业务并彻底解决问题。

阶段一:紧急恢复(恢复虚拟机运行)

  1. 立即清理存储空间
    • 登录UIS管理平台,优先检查 DATA03_HDD_20T存储。
    • 清理项目:删除不必要的虚拟机快照、清理废弃的虚拟机文件、上传的ISO镜像、临时文件等。删除快照是释放空间最有效的方式之一
    • 验证效果:清理后,刷新存储视图(两张图片的界面都刷新),确认 DATA03_HDD_20T的可用容量是否增加并稳定在一个正常值(例如大于几百GB)。
  2. 迁移虚拟机
    • 如果暂时无法清理出足够空间,或者清理后空间增加不明显,应立即将 DATA03_HDD_20T上暂停的虚拟机迁移到其他有充足空间的存储上(例如第一张图中的 DATA01_SDD_14.5T可用空间有6.77TB)。
    • 操作路径:在UIS管理界面中找到该存储上暂停的虚拟机,选择“迁移”操作,并选择目标存储(如 DATA01_SDD_14.5T)。
  3. 恢复虚拟机
    • 在存储空间问题解决后(无论是通过清理还是迁移),选中那些处于“暂停”状态的虚拟机,选择“启动”或“恢复”操作,它们应该能够正常启动。

阶段二:根本性解决与预防

  1. 扩容存储(最根本的解决方案)
    • 从图片看,DATA03_HDD_20T和 DATA05_HDD_20T的使用率都已非常高(超过90%!)(MISSING),这本身就是高风险状态。
    • 请联系您的存储管理员,对 DATA03_HDD_20T以及 DATA05_HDD_20T这两个存储卷进行扩容。这是避免问题再次发生的最有效措施。
  2. 建立监控告警机制
    • 在UIS平台或您的运维监控系统(如Zabbix, Prometheus)中,为所有数据存储的容量使用率设置阈值告警(例如,使用率超过80%!时(MISSING)发出警告,超过90%!时(MISSING)发出严重告警)。
    • 这样可以在空间耗尽前提前干预,避免业务中断。

阶段三:问题排查(针对显示不一致)

在紧急问题解决后,可以排查为何会出现显示不一致:
  • 刷新与检查:在多台管理节点和主机上刷新存储容量视图,确认是否所有节点显示都已一致。
  • 检查存储链路:让存储管理员和网络管理员协助检查主机到存储的网络连接和多路径状态,确保没有单点故障或异常。
  • 查看存储层日志:登录存储设备本身,检查其容量信息、快照占用情况以及是否有相关告警日志。

总结

当前,您的首要任务是立即为 DATA03_HDD_20T释放空间或迁移虚拟机,以恢复暂停的虚拟机的运行。之后,请务必对高使用率的存储进行扩容设置监控告警,以防未来再次发生同类故障。希望这些步骤能帮助您快速解决问题!如果您在操作中遇到任何具体困难,欢迎随时补充信息。

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明