CloudOS E5132P03版本部署服务网关时(版本适配),部署进度到95%时提示失败,失败信息为:failed: io.grpc.statusRuntimeException: UNKONWN: Job failed: BackoffLimitExceeded,如图:
1、服务网关后台均以pod的方式部署,提供服务,前台提示部署失败,可以通过后台查看pod的相关问题定位
2、后台查看相应服务网关的pod,发现后台有较多pod error:
3、后台查看相应pod的日志打印信息: kubectl logs -n cloudos-svcgw-copywebfile-8tplh cloudos-svcgw,有如下报错信息,提示无法ssh到node-xxx:
4、手动ssh到主机,发现无法ssh登录:
5、通过 kubectl get nodes -o wide发现此节点不是ready,无法调度的状态:
6、ping此节点也无法ping通,怀疑网络故障或者主机故障。
通过检查网络和服务器HDM服务器硬件信息发现故障节点处于关机模式,未正常开机。手动开机之后,待此节点正常加入到集群中,状态变为ready之后,重新部署即可。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作