• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

超融合卡动态资源调度任务怎么结束

  • 0关注
  • 0收藏,57浏览
粉丝:0人 关注:0人

问题描述:

已经卡了3天5%了

组网及组网描述:

3 个回答
粉丝:10人 关注:9人

登录H3C CAS云计算管理平台,进入【资源调度】→【动态资源调度】→【任务管理】,选中卡住的调度任务,点击【终止任务】即可。若页面操作无效,登录CVM节点执行命令cascli drs task stop <任务ID>(任务ID可在任务列表查看)。终止后可排查卡住原因(如节点资源不足、存储/网络异常),必要时手动触发资源调度。

请问后台查任务列表id的命令是啥

zhiliao_R45Bh 发表时间:2天前 更多>>

超融合平台没有资源调度这个页面啊,只有首页、虚拟机、网络、存储、主机、云业务、监控告警、管理

zhiliao_R45Bh 发表时间:2天前

请问后台查任务列表id的命令是啥

zhiliao_R45Bh 发表时间:2天前
粉丝:12人 关注:2人

一、先确认:是 DRS 任务卡住
你这个是 “动态资源调度(DRS)” 任务,本质是虚拟机热迁移 + 资源均衡,进度 5% 3 天基本是僵死了,前台一般点不动终止。
二、前台能操作的话(先试)
登录 UIS 管理界面:
进入 资源调度 → 动态资源调度 → 任务管理
找到那个 5%、运行中 的任务,点 终止任务
如果按钮灰掉、点了没反应 → 直接走下面后台方法。
三、后台命令行强制结束(重点)
1)SSH 登录控制节点(CVM / 管理 VIP)
bash
运行
# 默认账号密码(如改过用自己的)
admin / Admin@123
2)查看所有运行中 DRS 任务(拿到 TaskID)
CAS/UIS 旧版(cascli)
bash
运行
# 查看DRS任务列表
cascli drs task list
# 找到 Status=running、Progress=5% 的那行,记下 TaskID(如 drs-task-xxxx)
UIS 新版(uis-cli)
bash
运行
uis-cli task list --status running
# 找到类型是 drs/resource_schedule 的任务,记录 Task ID
3)强制终止任务
CAS 旧版
bash
运行
cascli drs task stop <TaskID>
# 示例:cascli drs task stop drs-task-12345
UIS 新版
bash
运行
uis-cli task cancel --task-id <TaskID>
执行后提示确认,输入 y 即可。
4)确认任务消失
bash
运行
cascli drs task list # 或 uis-cli task list --status running
看不到这个任务,说明结束成功。
四、还卡着?杀进程 + 重启服务(谨慎!)
1)找 DRS / 迁移进程
bash
运行
ps -ef | grep -i drs
ps -ef | grep -i migrate
# 看到类似 drs_worker、vtpdaemon 之类的僵死进程
2)强杀(最后手段)
bash
运行
kill -9 <PID>
3)重启 DRS / 调度服务(UIS)
bash
运行
supervisorctl restart drs
supervisorctl restart scheduler
五、为什么会卡(你必须查,否则还会复发)
存储问题:共享存储离线 / 只读、CEPH / 存储池空间满、OSD 挂了
网络问题:管理网 / 迁移网丢包、断连、VLAN 不通
主机资源耗尽:某台主机 CPU / 内存 100%,DRS 找不到目标
虚拟机磁盘异常:虚拟机磁盘损坏、快照链过长
排查命令(控制节点 / 主机):
bash
运行
# 存储
df -h
ceph -s
# 网络
ping 所有主机管理IP
# 主机负载
top
六、建议操作顺序(直接照做)
前台点终止 → 无效
SSH 登录控制节点 → cascli/uis-cli 终止任务(优先)
任务还在 → kill -9 进程
重启 DRS 服务
排查存储 / 网络 / 主机负载,解决根因

粉丝:17人 关注:1人

超融合平台的动态资源调度(DRS)任务卡住(例如卡在5%长达3天)是运维中偶尔会遇到的问题,通常是因为后台进程异常或资源死锁导致的。
你可以按照以下步骤,由浅入深地尝试结束这个卡住的任务:


 前台界面尝试取消(最基础)

首先检查管理平台界面是否有直接的终止入口:
  1. 登录超融合管理平台(UIS/CAS)。
  2. 在界面的右上角找到“任务台”、“任务中心”或“最近任务”的小图标(通常是一个时钟或列表样式)。
  3. 在弹出的任务列表中,找到这个卡住的 DRS 任务。如果界面提供了“取消”“终止”按钮,直接点击即可。


 后台命令行强制结束(最有效)

如果前台界面没有按钮,或者点击后无响应,需要通过后台命令行来精准终止。
  1. 使用 SSH 工具(如 Xshell、Putty)登录到超融合集群的 CVM 节点(主控节点)
  2. 执行以下命令,查看当前正在运行的任务,并找到卡住任务的 Task ID(任务ID):
    1uis-cli task list --status running
  3. 找到对应的任务 ID 后,执行以下命令强制取消该任务(将 <任务ID> 替换为实际查到的 ID,例如 task-12345):
    1uis-cli task cancel --task-id <任务ID>
    (注:在部分旧版本的 CAS 平台中,也可以尝试使用 cascli drs task stop <任务ID> 命令。)


 重启管理服务清理任务队列(兜底方案)

如果上述命令执行后任务依然卡在界面,或者无法定位到具体的任务 ID,可以通过重启后台管理服务来强制清理卡死的任务状态。
在 CVM 节点的命令行中,依次执行以下命令:
1service cas-service restart 2# 或者 3service uis-admin restart
  • 注意:重启管理服务期间,超融合的管理页面会短暂无法访问(通常 1-3 分钟),但这不会影响平台上已经正常运行的虚拟机业务。服务重启完成后,刷新浏览器,卡住的任务通常就会自动消失。

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明