5.0还是7.0?
从您提供的截图来看,您遇到的是 CloudOS 平台中非常关键的 cert_expire(证书过期) 严重告警。
根据 CloudOS 的告警信息参考手册
告警名称:cert_expire
告警级别:严重
报错详情:
/etc/docker/certs.d/os-harbor-svc.default.svc:443/ca.crt 无效。当前时间: (1766149633) 结束时间: (1704256920)
受影响文件:ca.crt。这是 Docker 客户端用来验证镜像仓库(Harbor)身份的 CA 根证书。
路径:/etc/docker/certs.d/os-harbor-svc.default.svc:443/。这是 Docker 存放受信任镜像仓库证书的标准路径。
时间戳解读:
结束时间 (过期时间):1704256920 $\rightarrow$ 2024年01月03日
当前系统时间:1766149633 $\rightarrow$ 2025年12月19日
结论:您系统上的 Harbor 证书已经过期了接近两年(相对于当前系统时间),导致 Docker 认为该证书无效。
2. 可能造成的影响
由于这是 Docker 访问 Harbor 镜像仓库的凭证,过期会导致以下严重后果:
镜像拉取失败:节点上的 Docker 守护进程无法与 Harbor 建立安全连接(TLS 握手失败)。
业务无法启动:如果 Pod 发生重启、迁移或新部署,会因为无法拉取镜像(ImagePullBackOff 或 ErrImagePull)而导致业务中断。
扩容失败:无法在节点上部署新的应用服务。
请按照以下步骤在报错节点(hlw-ywglq-cloudos-1)及其他节点上进行排查和修复:
登录到报错的后台节点,执行以下命令确认证书有效期:
openssl x509 -in /etc/docker/certs.d/os-harbor-svc.default.svc:443/ca.crt -noout -dates
如果 notAfter 的日期早于当前系统时间,则确认证书已过期。
虽然从时间戳看是证书过期,但请务必确认节点的系统时间是否准确。
date
chronyc sources # [cite: 16018]
如果系统时间正常(即确实是2025年),则必须更新证书。
CloudOS 的 Harbor 组件通常会自动更新内部证书,但可能没有同步到宿主机的 Docker 配置目录中。请尝试以下操作:
在 Master 节点查找是否有新的有效证书(通常在 Harbor 的持久化目录或 Secret 中)。
手动替换:如果您有新的 ca.crt 文件,请将其覆盖到报错路径:
# 备份旧证书
cp /etc/docker/certs.d/os-harbor-svc.default.svc:443/ca.crt /etc/docker/certs.d/os-harbor-svc.default.svc:443/ca.crt.bak
# 将新证书放入该目录 (假设新证书名为 new_ca.crt)
cp new_ca.crt /etc/docker/certs.d/os-harbor-svc.default.svc:443/ca.crt
分发到所有节点:该证书必须在集群内所有节点(控制节点和工作节点)的相同路径下保持一致。
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论