• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

uc2.0重建节点起不来

18小时前提问
  • 0关注
  • 0收藏,38浏览
粉丝:0人 关注:0人

问题描述:

reboot服务器后,pod都起不来,然后就删除节点重新加了,但是现在一直卡住加不上了

3 个回答
Xcheng 九段
粉丝:135人 关注:3人

打400吧。现在视乎问题还扩大了。。。赶紧摇人或找官方支持渠道

暂无评论

粉丝:174人 关注:0人

您好,找400吧

暂无评论

军刺 三段
粉丝:0人 关注:0人

要解决 UC2.0 重建节点后无法启动的问题,需从节点服务、网络连通性、认证配置、资源状态、集群残留数据等维度逐一排查,以下是分步骤的解决方案:

一、检查节点基础服务与日志

查看 kubelet 服务状态登录故障节点,执行以下命令检查 kubelet 是否正常运行:

systemctl status kubelet -l

journalctl -u kubelet -n 100 --no-pager

kubelet 未启动或日志中出现证书过期、配置文件错误、依赖服务缺失等提示,需针对性处理(如更新证书、修复配置)。

验证节点与控制平面通信测试节点到 Kubernetes APIServer 的网络连通性:

# 替换为实际APIServer地址(如控制平面节点IP:6443

curl -k https://<apiserver-ip>:6443/version

若无法连通,检查节点防火墙规则、路由配置或控制平面节点的网络策略。

二、排查认证与配置问题

检查 kubelet 认证配置确认/etc/kubernetes/kubelet.conf中的证书和服务账户 Token 有效:

# 检查证书过期时间

openssl x509 -in /var/lib/kubelet/pki/kubelet-client-current.pem -noout -text | grep Not

# 验证服务账户Token

kubectl -n kube-system describe secret $(kubectl -n kube-system get secret | grep <node-name>-token | awk '{print $1}')

若证书过期,需重新生成 kubelet 证书(可通过kubeadm alpha certs renew或手动生成);若 Token 无效,需重建节点的服务账户。

确认节点加入命令参数确保kubeadm join命令使用的TokenCA 证书哈希有效:

# 查看有效Token(控制平面节点执行)

kubeadm token list

# 检查CA证书哈希

openssl x509 -pubkey -in /etc/kubernetes/pki/ca.crt | openssl rsa -pubin -outform der 2>/dev/null | openssl dgst -sha256 -hex | sed 's/^.* //'

Token 过期,生成新 Tokenkubeadm token create --print-join-command

三、清理集群残留数据

若节点曾被删除但集群中仍有残留记录,会导致新节点加入失败,需清理 etcd 中的旧节点数据:

备份 etcd 数据(可选但建议操作)

ETCDCTL_API=3 etcdctl --endpoints=<etcd-ip>:2379 --cert=/etc/kubernetes/pki/etcd/server.crt --key=/etc/kubernetes/pki/etcd/server.key --cacert=/etc/kubernetes/pki/etcd/ca.crt snapshot save /tmp/etcd-snapshot.db

删除旧节点记录

# 列出所有节点

ETCDCTL_API=3 etcdctl --endpoints=<etcd-ip>:2379 --cert=/etc/kubernetes/pki/etcd/server.crt --key=/etc/kubernetes/pki/etcd/server.key --cacert=/etc/kubernetes/pki/etcd/ca.crt get / --prefix --keys-only | grep "/registry/nodes/<old-node-name>"

# 删除旧节点键值

ETCDCTL_API=3 etcdctl --endpoints=<etcd-ip>:2379 --cert=/etc/kubernetes/pki/etcd/server.crt --key=/etc/kubernetes/pki/etcd/server.key --cacert=/etc/kubernetes/pki/etcd/ca.crt del /registry/nodes/<old-node-name>

四、检查资源状态

节点资源不足会导致 Pod 无法启动,需确认以下资源充足:

CPU / 内存 / 磁盘空间

free -h  # 内存

df -h    # 磁盘(重点关注/var/lib/docker/var/lib/containerd目录)

top      # CPU使用

若磁盘空间不足,清理无用镜像或日志;若内存 / CPU 不足,可临时关闭非必要服务或扩容节点。

容器运行时状态确认 Docker Containerd 正常运行:

systemctl status docker  # containerd

docker ps -a  # 查看容器状态

五、重新加入节点

完成上述排查后,执行以下步骤重新加入节点:

重置节点(若之前加入失败残留配置)

kubeadm reset -f

rm -rf /var/lib/kubelet /etc/cni/net.d

执行 join 命令(控制平面节点生成最新命令)

kubeadm token create --print-join-command

# 复制输出的join命令到故障节点执行,如:

kubeadm join <apiserver-ip>:6443 --token <token> --discovery-token-ca-cert-hash sha256:<hash>

检查节点状态控制平面节点执行:

kubectl get nodes -o wide

kubectl get pods -A -o wide  # 确认Pod是否正常调度

六、典型故障场景与解决

场景 1kubelet 日志报 “x509: certificate has expired”解决方案:在控制平面节点执行kubeadm alpha certs renew kubelet-client-current,然后重启 kubeletsystemctl restart kubelet

场景 2:节点加入后状态为 “NotReady”,提示 “network plugin not ready”解决方案:检查 CNI 插件(如 CalicoFlannel)是否正常,执行kubectl -n kube-system get pods | grep cni,若有异常 Pod,删除后重建:kubectl -n kube-system delete pod <cni-pod-name>

场景 3etcd 集群健康状态异常解决方案:检查 etcd Pod 日志(kubectl -n kube-system logs <etcd-pod-name>),若存在数据一致性问题,可尝试重启 etcd Pod 或恢复快照。

通过以上步骤,可逐步定位并解决 UC2.0 节点重建后无法启动的问题。若仍无法解决,建议收集kubelet 日志、etcd 日志、节点资源使用情况等信息,联系官方技术支持进一步分析。

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明