某局点采用OLT设备P3617 两台实现双归属冗余备份功能。
【双归属方案】即两台P3617作为主备进行处理PON业务,同时只有主设备OLT收发光,备机不发光。
两台P36 OLT之间通过心跳线互联,心跳线采用主控卡上的ETH带外管理口作为互联。组网示意图如下:
目前该组网在现场运行半年无问题,此次反馈OLT下所有的ONU都注册不上线了,ONU业务受影响发生了中断,暂时未能恢复。
那么大概率存在心跳丢失的问题。只有心跳报文存在双归属才能建立,否则各自认为是主。
主OLT 1.1.1.1去ping 备OLT1.1.1.2发现不通,如下图:
主OLT上是可以看到备OLT的arp地址正常,如下图:
主OLT查看带外管理地址的配置状态正常,如下图:
备OLT查看带外管理地址的配置状态正常,如下图:
按照常理分析 这个带外互联接口是网线直连,没有外界干预,也就是说出现了ETH口直连不通的情况。
显示状态为disconnect,如下图:
也就是判断为主机的1.1.1.1响应存在问题,大概率主机是故障嫌疑。
电脑模拟主OLT的地址 1.1.1.1 直连备OLT的ETH 直连互ping可通,如下图:
电脑模拟备OLT的地址 1.1.1.2 直连主OLT的ETH 直连互ping可通,如下图:
此操作作为应急操作,先将故障业务恢复,保留一组业务不重要的继续与主OLT关联,进行后续的定位分析。
如下图分析日志 所得
这个状态下,主OLT从上行口收到1.1.1.2 的包,但是跟带外接收到的冲突,因此就把1.1.1.2阻止掉了
将主OLT的光纤拔掉,保持备OLT工作。
修改主备OLT的心跳同步地址,确保与外界的交互地址不冲突。