局点共8个节点,UIS版本E0802P01,现在需要缩容剔除1个节点出来,目前按照官网扩容缩容手册指导,删除主机任务,发现存储节点已经100%,但是删除主机进度卡在99%,后台ceph -s查看状态为HEALTH_WARN,pgs状态百分比缓慢降低,osd状态仍然up。



ceph -s显示状态为HEALTH_WARN,pgs状态百分比缓慢降低,osd状态仍然up,这种情况不一定是任务卡死,可能是缩容过程中数据迁移等操作尚未完成。以下是对相关问题的分析和解答:pgs状态百分比在缓慢降低,说明系统可能仍在进行数据重新分布等操作。当存储节点利用率达到 100% 时,数据迁移的速度可能会受到影响,导致删除主机的进度长时间停留在 99%。/var/log/ceph/目录下,通过分析日志可以了解到 Ceph 集群在删除主机过程中的具体操作和遇到的问题。uis -cli task list --status running命令查看正在运行的任务状态。在 Ceph 中,可以使用ceph -w命令持续观察 Ceph 集群的状态变化,包括pgs的状态、数据迁移的进度等。uis -cli命令行工具强制终止任务,然后再重新尝试删除主机操作,但在操作前一定要备份好重要数据。感谢老师解答
问题已处理。
1、按照官网缩容主机流程指导手册操作即可。
2、删除管理平台删除主机进度卡在99%,是因为本局点需要被踢出集群的node硬盘空间较大(21T),当PGS的百分比状态降到0%后(具体等待时间因节点硬盘空间而定),该主机节点会自动被平台集群剔除,完成删除主机节点操作。
3、删除完了后,登录到被剔除的节点ceph -s就显示无存储集群了。
4、登录到正常的其他节点,ceph -s检查UIS存储集群状态为health_ok即可。
5、判断剔除主机过程是否为卡起状态,可以通过ceph -w | grep bakcfill查看是否存在删除任务,是否仍然在做数据平衡(回填)操作(实时回显数据平衡任务)。

命令单词打错了,是ceph -w | grep backfill
命令单词打错了,是ceph -w | grep backfill
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
感谢老师解答