某广电S7500E流量泛红定位的经验案例
一 组网:
H3C S7500E OLT---ONU---CC700E---(业务1)EOC终端+PC(上网业务VLAN1000)/(业务2)EOC模块+机顶盒(IPTV业务VLAN1000,IP网段与PC不同)
二 问题描述:
白天没有出现丢包,同时IPTV正常,晚上6点后开始出现2类业务ping包同时丢包,同时IPTV画面抖动,这种情况共出现多次,每次出现5分钟左右自动消失。
三 过程分析:
故障时刻在某个EOC终端下联业务VLAN的PC(接在ONU2/0/3:1)上抓包,发现大量发给其它OUN的单播报文。多个点抓包测试后发现发给某个ONU的下行报文能够在同一OLT口下的其它ONU上抓到,出现了泛洪的情况。在业务正常时抓不到这种报文,由此可以确认丢包和IPTV画面抖动与泛洪情况直接相关。
进一步查看泛洪时报文的目的MAC地址,在设备上查看ARP表项该MAC有对应的出接口,且端口正确,理论上不应该出现泛红。
另外,通过抓包发现每次泛洪的报文目的均不一样,出现随机的情况。
在故障时发现一个细节,泛洪报文的目的MAC在交换机上有对应的ARP表但无对应的MAC表,说明此时这个MAC已经老化,这台终端实际已经不在线了。
在泛洪时找到泛洪报文目的MAC后在设备上删除对应的ARP表项故障可以立刻恢复。
为什么终端已经不在线了下行报文却依旧会持续发一段时间,导致流量泛洪呢?
结合用户的实际业务最终找到了答案。
Epon网络比较特别一点,普通以太网上,根据ARP表报文会直接发给出端口,不看MAC地址表。而Epon网络中,由交换芯片和PON芯片一起构成,交换芯片告诉Pon芯片中的内容中不含ONU的出端口,Pon芯片自己根据MAC查找出ONU端口转发。这样就会出现交换芯片有ARP,Pon芯片无MAC导致的某个OLT口下泛洪发生(这个泛洪只影响该OLT口不会影响其它OLT口)。
如果是普通的业务,由于报文有交互,终端掉线后下行报文也不会再发了,因此不会发生这种情况。而该局点是推流业务,软件上心跳做的比较长,终端掉线后下行报文还会发一段时间,这段时间流量就泛洪了。
四 解决方法:
把MAC地址老化时间调整为等于或超过ARP老化时间解决。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作