某局点使用华为的2288H V5部署裸金属,在os界面点击发现后一段时间就会报发现失败。
1、要使服务器能够正确的发现和部署,服务器需要满足如下条件:
添加节点时选择的启动模式和服务器上的启动模式一致;
接入管理网的网卡的网络启动功能(PXE)已开启。
经排查,现场这两项都是符合要求的。
2、查看裸金属计算节点上的发现日志,/var/ironic-inspector/xxx.log,在故障时间点里打印发现超时。怀疑是现场网络或者服务异常问题,导致计算节点与裸金属之间通信不畅。
3、让现场连接带外管理口查看服务器的实际状态,发现其没有dhcp获取到地址,一直在初始化和建立连接中:
4、服务器没有获取到地址,存在三种可能:
裸金属计算节点DHCP服务异常;
网络环境配置存在问题;
服务器配置或硬件存在问题。
首先检查一下DHCP服务是否正常,在裸金属计算节点后台输入命令:
systemctl status openstack-ironic-inspector-dnsmesp.service
该服务的确异常,尝试手动重启一下该服务,命令为:
systemctl restart openstack-ironic-inspector-dnsmesp.service
待服务正常后再次执行发现操作,在带外口还是显示没有分配到dhcp地址。让现场用个人电脑连接进行测试,发现是能dhcp获取到地址的,说明现场计算节点的dhcp服务和网络层面应该是没有问题,应该是服务器配置或硬件存在问题。
5、硬件侧问题解决后再次点击发现,此次带外管理界面可以正常获取到地址。等相关组件安装完成后发现成功。
如上分析,裸金属发现失败通常与相关服务和网络配置关联性较大,可以利用带外管理界面查看相应的进程。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作