各位大佬,有一个疑问需要请教一下,现在是两节的超融合UIS测试,现在是系统底层是完全正常状态,但是模拟测试把主节点拔电模拟故障平台访问不了,浮动IP也是无法访问
(0)
根据提供的日志和配置信息,UIS超融合两节点环境下主节点断电后无法通过浮动IP访问的可能原因如下:
1. **双机热备依赖仲裁机制**
- 两节点单存储架构默认未配置独立仲裁节点(需第三方仲裁或Ping方式仲裁)。若未明确配置仲裁策略,主节点故障时备节点无法完成自动切换,导致浮动IP漂移失败。
2. **存储元数据副本限制**
- 两节点初始化时存储元数据副本数为2(与节点数相同)。当主节点宕机后,剩余节点无法满足元数据副本的冗余要求(需至少N-1节点存活),导致存储服务异常,进而影响管理平台访问。
3. **双机热备通信异常**
- 日志中提示`cmsd热备服务无法连接主/备机`,需检查:
- 主备节点间管理网、存储网是否正常(使用`ping`及`iostat`排查网络/磁盘状态)。
- 文件系统inode是否耗尽(执行`df -i`确认)。
- 系统盘读写是否正常。
4. **手动恢复脚本未执行**
- 若备节点未通过`ms_recovery.sh`脚本主动接管服务(需输入备节点IP、密码等参数),故障后需人工干预恢复,无法实现自动切换。
**建议操作步骤**
1. 检查双机热备仲裁配置,确认是否配置简易Ping仲裁或其他仲裁方式。
2. 在主节点恢复后,通过`ms_recovery.sh`脚本重新同步主备数据。
3. 验证存储节点数是否满足元数据副本数要求(缩容需保证节点数>副本数)。
4. 联系H3C技术支持,获取两节点环境专用容灾方案(如强制切换命令或配置第三方仲裁节点)。
若上述步骤无法解决,需结合具体日志(如`/var/log/cmsd/cmsd.log`)进一步分析网络或存储异常。
(0)
采用高级仲裁方式,有终端为仲裁节点,拔主节点之前测试拔备节点是可以正常访问的,直接模拟主故障无法访问,浮动ip,虚拟组件IP都不通
根据信息,在高级仲裁场景下主节点故障后浮动IP和虚拟IP不通,需重点检查以下配置: 1. **仲裁机制有效性** 确认仲裁节点与主备节点的通信状态,使用`crm status`检查仲裁判定结果。若主备节点同时向仲裁发送状态异常,仲裁可能无法正确裁定新主节点。 2. **DRBD同步状态** 主节点故障前需确保数据已实时同步到备节点。若DRBD未完成同步,备节点可能拒绝接管服务。通过`cat /proc/drbd`检查同步进度。 3. **虚拟IP漂移验证** 检查备节点是否成功绑定浮动IP。使用`ip addr display`查看虚拟IP是否漂移到备节点,并确认网络设备允许ARP更新。 4. **仲裁配置一致性** 核对主备节点`/etc/cmsd/cmsd.xml`中仲裁类型(type="1")、仲裁IP、主机名是否一致。若主机名未同步修改会导致仲裁异常(参考最后一段案例)。 5. **服务重启顺序** 确保按文档要求先停备节点服务(`service cmsd stop`),再重启主节点服务(`service cmsd restart`),最后启动备节点服务。顺序错误可能导致脑裂。 6. **网络隔离检测** 主节点故障时若同时触发网络隔离,需确保备节点能通过至少一个仲裁IP(高级仲裁)或两个Ping IP(简易仲裁)判定自身为有效节点,否则会进入保守模式拒绝接管。
您好,在进行超融合UIS测试时,如果主节点拔电导致平台和浮动IP无法访问,可以按照以下步骤进行排查和解决:
ACTIVE 。
/var/log/目录下 。
ping命令测试浮动IP的可达性,确保网络连接正常 。
(0)
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
根据信息,在高级仲裁场景下主节点故障后浮动IP和虚拟IP不通,需重点检查以下配置: 1. **仲裁机制有效性** 确认仲裁节点与主备节点的通信状态,使用`crm status`检查仲裁判定结果。若主备节点同时向仲裁发送状态异常,仲裁可能无法正确裁定新主节点。 2. **DRBD同步状态** 主节点故障前需确保数据已实时同步到备节点。若DRBD未完成同步,备节点可能拒绝接管服务。通过`cat /proc/drbd`检查同步进度。 3. **虚拟IP漂移验证** 检查备节点是否成功绑定浮动IP。使用`ip addr display`查看虚拟IP是否漂移到备节点,并确认网络设备允许ARP更新。 4. **仲裁配置一致性** 核对主备节点`/etc/cmsd/cmsd.xml`中仲裁类型(type="1")、仲裁IP、主机名是否一致。若主机名未同步修改会导致仲裁异常(参考最后一段案例)。 5. **服务重启顺序** 确保按文档要求先停备节点服务(`service cmsd stop`),再重启主节点服务(`service cmsd restart`),最后启动备节点服务。顺序错误可能导致脑裂。 6. **网络隔离检测** 主节点故障时若同时触发网络隔离,需确保备节点能通过至少一个仲裁IP(高级仲裁)或两个Ping IP(简易仲裁)判定自身为有效节点,否则会进入保守模式拒绝接管。