在 ADDC 7.3 环境中,三节点容器化部署 DC 组件后,登录控制器却看不到组件信息,这通常属于“部署动作完成但服务未正常注册”的范畴。
登录 ADDC 控制器 Web 界面,进入 “系统管理 → 组件管理” 或 “资源管理 → 虚拟资源 → 计算资源” 等对应菜单。
完全没有 DC 组件条目 → 说明组件未向控制器注册成功
有条目但状态为“离线/异常” → 说明注册过,但心跳/服务失败
你提到“看不到控制器组件信息”,应优先按 未注册 方向处理。
在任一部署节点上执行:
所有容器状态为 Up / Running
没有频繁重启(RESTART 次数很低)
若有容器未运行,先排查容器启动失败原因(日志、资源、镜像)。
DC 组件启动后会主动向 Controller 的 服务注册中心(etcd / consul / 平台内部服务) 上报。
方法一(推荐):在 Controller 节点上查看服务列表
Controller 地址配置错误
网络不通(防火墙、路由)
证书/认证失败
在 DC 容器内部测试连通性:
检查 主机防火墙(iptables / firewalld)
检查 docker 网络模式 是否与 controller 网络互通
如果是跨网段部署,确认路由正确
登录 Controller 后台(命令行),执行:
若 Controller 侧完全无记录,则表明注册链路存在问题。
ADDC 7.3 容器化部署通常涉及:
installer.cfg 或 values.yaml 中 controller_ip / mgmt_ip 是否填写正确
是否指定了正确的 部署角色(DC / 控制节点 / 计算节点)
三个节点的 时间是否同步(时间差过大会导致注册认证失败)
检查部署时使用的配置文件,确认:
| 位置 | 日志路径 / 命令 |
|---|---|
| 部署节点 | /var/log/installer/deploy.log |
| DC 容器 | docker logs <container> |
| Controller 组件 | kubectl logs -n cloudos <controller-pod> |
| 服务注册 | tail -f /var/log/cloudos/register.log |
重点关注:
connection refused
certificate
timeout
authentication failed
| 现象 | 可能原因 | 解决方法 |
|---|---|---|
| 容器全部 Running,但 Controller 无记录 | 注册地址错误或网络不通 | 检查 controller_ip 配置,确保容器能访问 Controller 端口 |
| 部分容器重启频繁 | 资源不足或配置错误 | 查看容器日志,调整内存/CPU 资源限制 |
| 日志显示证书错误 | 证书未同步或过期 | 重新生成证书,确保所有节点时间同步 |
| 三节点部署但仅部分注册 | 节点间通信异常 | 检查主机路由、防火墙策略 |
优先查看 DC 容器日志,这是最快定位问题的途径。
确认三节点时间同步,使用 chronyc sources 或 ntpq -p 检查。
如果以上均正常,可能是部署脚本或版本兼容问题,建议:
检查 ADDC 版本与容器镜像版本是否匹配
重新执行 register 组件步骤(如有单独注册脚本)
怎么查看容器namespace
怎么排查
怎么查看容器namespace
# 查看所有DC组件Pod状态(重点看Phase是否为Running)
kubectl get pod -A | grep dc
# 查看组件容器日志(定位启动失败原因)
kubectl logs -f <dc组件Pod名称> -n <命名空间>
# 查看组件服务状态(确认核心进程是否就绪)
systemctl status seer-dc
Pending/Error/CrashLoopBackOff:容器启动失败,需解决资源不足、镜像异常、依赖缺失等问题。Running但控制器无组件:组件未注册或集群通信异常,进入下一步排查。| 排查项 | 操作命令 | 判定标准 |
|---|---|---|
| 节点 IP 互通 | ping 其他节点 IP | 丢包率 0ms 延迟 < 1ms |
| 组件端口可达 | telnet 节点 IP 组件端口(默认:8080、8443、6443) | 端口连通无超时 |
| 防火墙 / 安全组 | 关闭防火墙或放行组件端口 | 无端口拦截 |
| 路由 / 网关 | 查看路由表route -n | 无路由环路,网关可达 |
# 查看集群成员列表
kubectl get nodes
# 查看组件注册记录
kubectl get dc-cluster
# 查看组件CRD状态
kubectl get seerdc
kubeadm join或重置集群网络。# 删除异常镜像
crictl rmi <dc镜像ID>
# 重新拉取指定版本镜像
crictl pull seer-dc:7.3.0
# 重启容器
kubectl rollout restart deployment <dc组件名称> -n <命名空间>
kubelet与csi-plugin正常运行,磁盘挂载无异常。# 配置主机名
hostnamectl set-hostname dc-node-01/02/03
# 编辑hosts文件,添加三节点IP与主机名映射
vi /etc/hosts
# 复制主节点CA证书到其他节点
scp /etc/kubernetes/pki/ca.crt root@其他节点IP:/etc/kubernetes/pki/
# 重启kube-apiserver
systemctl restart kube-apiserver
cluster-id与node-ip参数,重新应用。undo port-isolate,确保三节点间互通。# 查看Calico/Flannel状态
kubectl get pod -n kube-system | grep calico/flannel
# 重启异常网络插件Pod
kubectl delete pod <calico/flannel Pod名称> -n kube-system
# 安装NTP服务
yum install ntp -y
# 配置NTP服务器(统一使用主节点或外部NTP)
vi /etc/ntp.conf
# 启动NTP服务并设置开机自启
systemctl start ntpd && systemctl enable ntpd
# 同步时间
ntpdate -u 主节点IP
# 进入组件证书目录
cd /opt/seer-dc/cert
# 删除旧证书
rm -rf *
# 重新生成证书
./generate-cert.sh --ip 节点IP --domain 集群域名
# 重启组件服务
systemctl restart seer-dc
kubectl get pod -A | grep dc → 解决启动异常。kubectl get nodes+kubectl get dc-cluster → 解决注册失败。date+ 证书文件有效期 → 解决时间 / 证书问题。kubectl logs+dmesg → 定位隐性异常。
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明