• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

cloudos创建虚拟机造择主机原则

  • 0关注
  • 0收藏,80浏览
粉丝:0人 关注:0人

问题描述:

当前平台使用cloudos DcM纳管CAS平,在创建虚拟机时不会选择负载较轻的主机。如:集群当前有4台物理主机,主机4内存利用率在90%,其他三台主机利用率在60%,新创建虚拟机还是在主机4运行。且在cas台和cloudos平台无法开启DRS动志调度功能,cas版本E0730P11,cloudos版本E8003P01。

4 个回答
粉丝:0人 关注:0人

看看/etc/nova/nova.conf的ram_allocation_ratio(内存超分配比)参数设置,是不是设置太高了

暂无评论

粉丝:10人 关注:9人

排查解决步骤:
1. CAS侧开启DRS:登录CAS管理→对应集群→【DRS调度】→勾选“启用动态资源调度”,保存。
2. CloudOS侧确认调度策略:CloudOS→【资源调度】→【调度策略】→将默认策略设为“最优负载调度”,创建虚拟机时选“自动调度”。
3. 调整主机阈值:CAS主机属性中,内存过载阈值设为≥90%,避免误判。
4. 版本补丁:该组合(CAS E0730P11+CloudOS E8003P01)需打CAS E0730P12、CloudOS E8003P02补丁,官网H3C服务支持下载对应补丁即可解决调度异常。

暂无评论

粉丝:11人 关注:2人

  • 你现在现象:新建 VM 总往负载高的主机 4 上跑,不会自动选负载最轻的
  • 根本原因:CloudOS DCM 纳管 CAS 时,E0730P11+E8003P01 这代版本,默认调度策略不是 “最低负载优先”,且 DRS 受版本 / 配置限制无法开启
  • 短期:可以改调度策略、关掉主机 4 的自动调度、用反亲和;
  • 中长期:必须升级 CAS+CloudOS 版本才能正常用 DRS 和负载均衡调度
下面分三块讲:1)CloudOS/CAS 默认选主机原则;2)你环境为什么不负载均衡、DRS 灰掉;3)可行解决办法。

一、CloudOS + CAS 创建 VM 时,默认选主机原则(官方)

在 CAS/CVM 和 CloudOS 文档里明确:
集群上新建虚拟机时,默认选择资源最优的主机,优先判断:
  1. 虚拟机数量最少
  2. 内存利用率最低
  3. CPU 利用率最低
注意:是 “综合最优”,不是单纯看内存利用率,并且是静态放置策略,不是 DRS 动态迁移。

但你看到:主机 4 内存 90%,其他 60%,还往 4 上放

典型几种原因(非常普遍):
  1. 调度权重不是内存优先
    • 老版本默认更看重:虚拟机数量、CPU、内存综合分
    • 哪怕内存 90%,如果上面 VM 数量少、CPU 闲,也会优先选它。
  2. 主机 4 有 “亲和 / 绑定” 或残留配置
    • 有 VM 和主机绑定(不迁移);
    • 主机标签、资源池、业务模板绑定,强制往 4 上放;
    • 部分 VM 是本地盘(非共享存储),只能在原主机创建 / 重启。
  3. CloudOS DCM 纳管后,调度策略被覆盖
    • 被 DCM 的 **“主机组 / 可用域 / 资源分配策略”** 强制指定;
    • 或者勾选了 **“指定物理主机 / 绑定主机”**。
  4. 主机 4 内存是 “高配置 + 超分 / 大页”
    • 物理内存大,虽然利用率 90%,但剩余绝对值并不小
    • 其他主机内存小,60% 但剩得更少;
    • 开启内存复用 /ballooning后,利用率计算方式会变。

二、为什么 CAS E0730P11 + CloudOS E8003P01 无法开启 DRS

1)版本兼容性问题(最关键)

  • CAS:E0730P11(比较老的分支)
  • CloudOS:E8003P01(对应 DCM 纳管 CAS 场景)
官方兼容性说明:
  • E0730 系列 CAS,对 CloudOS DCM 的 DRS 支持非常有限
  • 在很多组合下:DRS 选项置灰、无法勾选、开启报错
  • 必须升级到 E0730P17+ 或 E08xx 系列 CAS + 对应 CloudOS 版本,DRS 才能正常用。

2)DRS 开启的硬性前提(你环境大概率没满足)

就算版本对,也要全部满足:
  1. 集群所有主机CPU 型号 / 特性兼容(不然后期迁移会蓝屏);
  2. 所有 VM 必须在共享存储(本地盘 VM 不能 DRS 迁移);
  3. 集群网络一致(相同 VLAN、分布式交换机 / 端口组一致);
  4. CAS 集群内没有绑定主机的 VM
  5. CloudOS 侧DCM 纳管正常、状态同步正常、无告警
你现在:
  • DRS 直接开不了,说明版本组合不支持 + 可能前置条件也不满足

三、你现在环境的解决方案(分:临时 / 长期)

方案 A:临时解决 —— 让新 VM 不往主机 4 跑(立刻见效)

1)在 CloudOS 里修改 “资源分配策略”

  1. 进入:云资源 → 计算 → 集群 → 资源分配策略
  2. 把调度策略改成:
    • 优先:内存利用率最低
    • 次要:CPU 利用率
    • 关闭 “优先选择 VM 数量最少”(老版本可能没有,尽量调权重)

2)把主机 4 设为 “维护模式 / 不参与调度”(最快)

  1. CloudOS:主机 → 主机 4 → 更多 → 设为维护模式
  2. 或在 CAS:主机 → 禁用 “自动调度到此主机”
  • 效果:新 VM 绝对不会往 4 上放
  • 缺点:4 不再承载新业务,适合紧急规避。

3)用 “反亲和性” 让同业务 VM 分散(推荐)

  1. 创建反亲和性组:要求同一组 VM不在同一主机
  2. 新建 VM 时加入该组;
  3. 这样就算主机 4 负载高,也会强制分到其他三台。

方案 B:中长期根治 —— 升级版本,开启 DRS(根本解决)

1)版本升级建议(官方兼容组合)

  • CAS:升级到 E0730P17 及以上E0810/E0820
  • CloudOS:升级到 E8005P0x / E8006 对应兼容版本
  • 升级后:
    • DRS 选项正常可勾选;
    • 支持自动负载均衡、VM 动态迁移、开机放置优化

2)升级后 DRS 配置要点

  1. CAS 集群开启计算 DRS,策略选:
    • 阈值:中等(默认)
    • 调度依据:CPU + 内存
  2. CloudOS 侧同步开启动态资源调度
  3. 所有 VM 迁移到共享存储
  4. 解除所有主机绑定 / 亲和强制规则

四、总结成一句话

  • 默认选主机:优先 VM 数最少→内存最低→CPU 最低,是综合分,不是只看内存百分比
  • 你环境 DRS 开不了 = E0730P11+E8003P01 版本组合不支持 DRS
  • 短期:把主机 4 设为维护模式 / 改调度权重 / 用反亲和
  • 长期:升级 CAS+CloudOS 版本,才能真正自动负载均衡

暂无评论

粉丝:17人 关注:1人

在 CloudOS 纳管 CAS 的架构中,创建虚拟机时没有自动选择负载较轻的主机,通常不是系统故障,而是由计算规格(模板)中的分配策略集群资源调度设置决定的。
结合你的具体情况(CAS E0730P11,CloudOS E8003P01),以下是导致该现象的几个核心原因及排查解决思路:

1. 检查“计算规格”中的物理机分配策略(最常见原因)

在 CAS 和 CloudOS 中,虚拟机的创建位置往往受其绑定的“计算规格(Flavor)”或模板中的物理机分配策略控制。如果该策略没有设置为按负载分配,系统就会忽略主机的实时负载。
  • 排查方法:进入 CloudOS 或 CAS 后台,查看你创建虚拟机时所选的计算规格(或云主机模板)的详细配置。
  • 调整建议:检查“物理机分配策略”选项,将其修改为以下按负载分配的模式之一:
    • CPU使用率最低:系统会采集一段时间内(默认通常为10分钟)物理机的CPU负载数据,优先选择平均CPU使用率最低的物理机来创建云主机。
    • 内存使用率最低:优先选择内存使用率最低的物理机。
    • 运行云主机数量最少:优先选择当前运行虚拟机数量最少的物理机。
    • 注意:如果策略被设置为“首选上次所在物理机”、“随机分配”或指定了特定的“亲和性组”,系统就不会去判断主机的实时负载。

2. 检查集群的 DRS(动态资源调度)设置

你提到“无法开启 DRS 动态调度功能”,这可能是导致虚拟机创建时不均衡,且后续无法自动迁移的根本原因。
  • DRS 的作用:DRS 分为两个层面:
    1. 初始放置:在虚拟机创建或启动时,根据当前负载推荐或自动选择最合适的主机。
    2. 动态负载均衡:在虚拟机运行过程中,定时检测集群负载,通过热迁移(vMotion)将虚拟机从高负载主机迁移到低负载主机。
  • 排查与解决
    • 如果 DRS 处于关闭状态,集群就失去了自动平衡负载的能力。你需要排查 CAS 集群配置中 DRS 无法开启的具体报错(通常与 CPU 兼容性模式、共享存储配置或授权有关)。
    • 在 CAS 的集群属性中,确保开启了“启用 DRS”以及“自动化”级别(如“全自动”)。

3. 检查是否指定了“资源分配方式”

在 CloudOS 申请或新建云主机的向导中,有一个“资源区域”的选项。
  • 排查方法:检查在创建虚拟机时,是否勾选了“指定资源分配方式”(例如指定了具体的物理主机,或者指定了某个亲和性组)。如果勾选了指定物理主机,调度系统会强制将虚拟机下发到该主机,完全忽略负载情况。

4. 目标主机的资源与状态限制

即使策略正确,如果其他三台负载较低(60%)的主机存在以下情况,系统也会被迫选择主机4:
  • NUMA 与大页内存限制:如果你的虚拟机开启了“大页内存”或绑定了特定的 NUMA 节点,而其他三台主机没有开启大页内存,或剩余的大页内存不满足该虚拟机的规格要求,调度器会直接过滤掉这三台主机。
  • 主机状态异常:检查其他三台主机在 CAS/CloudOS 中是否处于“维护模式”、“暂停”或“资源超分受限”的状态。

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明