EPCN网络中高清机顶盒点播卡处理经验案例
一、 组网:
在某广电高清互动电视项目中,采取IPTV方式进行高清的互动点播业务,其上下行数据传输,采取H3C EPON+EPCN方式传输。其EPON网络头端为S7600 Olt板,终端ONU采取ET254G千兆ONU;其EPCN采取新一代设备,头端采取CC720E ,终端采用CB303A。下图为单个终端的组网示意图。
图一-1 网示意图
由上图可知,机顶盒点播高清节目,上行点播指令经过CB303A、CC720E、ET254-G、S76到点播服务器,节目数据流下行从远端服务器10.254.251.14发UDP点播流经过S76、ET254-G、CC720E、CB303A到机顶盒。
二、 问题描述:
机顶盒点播高清节目时,大概率会出现点播视频卡,不流畅情况。
如果将机顶盒接入在ONU下或EPCN头端CC720E侧,则不会出现点播卡问题。
三、 过程分析:
现场通过同时在EPON网络端和EPCN网络端的抓包分析,在EPON网络中,高清点播流量平滑,流量稳定在9-10Mbps,如下图所示。
图2 正常点播情况下的流量图
但经过EPCN网络后机顶盒客户端点播情况,如下图所示,流量呈锯齿状并有明显的跌落。
图3 异常点播情况下的流量图
如下图4所示,经过抓包分析,点播流使用UDP协议进行传输,从UDP的上层协议中可以看出,数据有丢失“SKIPS=14”,如下所示。经过对比EPCN头端处的抓包情况,与上层协议记录的丢失的数据吻合。
图4 UDP数据包丢失
经过EPCN网络后为什么数据会有丢失情况,是什么导致了EPCN网络中数据丢包?
问题集中在EPCN网络上,需要排查有那些原因引起丢包。经过排查EPCN的Cable网路配置,没在Cable上做限速,也没有在以太网口上做限速;高清业务带宽只有9-10Mbps,也未超过单个终端100Mbps的带宽;机顶盒与CB303A的以太网口协商为100M全双工,也没有异常协商问题;其他配置上可以引起丢包的原因只有广播风暴抑制功能,但是高清点播的数据为单播数据,应该不会触发广播风暴抑制功能,但经过实验和CB303A的端口统计信息证明,将广播风暴抑制关闭后现象消失,经过多次测试证明,关闭广播风暴有效。
广播风暴抑制功能开启后,Cable网桥可以有效地抑制广播流量,避免网络拥塞,保证网络业务的正常运行,所以关闭广播风暴抑制不是最恰当的解决方案。
分析引起终端广播风暴抑制的条件,可能的原因有:
n 在终端所在的二层网络内有广播报文泛洪,广播报文被抑制。
n 在终端所在的二层网络内,有未知的单播报文,当接收端未学习到目的地址MAC将在全网进行广播,而被广播抑制功能抑制。
根据终端抓包排查,二层网络中并未出现广播报文泛洪情况,排除第一种情况;第二种情况,经过在EPCN头端查看MAC表项,发现MAC地址已经学习超过1.2K,超过终端的表项,如下图所示。
我们将已经导出1.2K个MAC地址,通过终端MAC地址算法计算,之后得出了MAC地址哈希冲突所导致的溢出情况,详细分析如下:
EPCN CB303A终端的MAC地址算法:总共有512个index,每个index中能放置4个经过哈希算法后的MAC地址,每个index中超过4个的mac地址会放置到另外16个MAC地址的空间中,如果这16个空间的MAC地址也满了,新增的冲突MAC就无法再学习了。如下图所描述:
在hash_count中已看出有88个index已超过4个mac地址,另外16个mac地址的空间也已经被占满了,这时增加的mac地址经过哈希后,只要落在这88个index中,就会溢出,导致不学习。最坏的情况如果机顶盒连续的几个mac地址经过哈希都映射在学满的几个index中,就会出现新加入的机顶盒mac地址无法学习到情况。
我们再看下CB303A的工作过程,正常情况下,设备启动时,CB303A设备交换芯片MAC地址表是空的,此时S76网关发送一个帧给机顶盒,那么当CB303A设备交换芯片接收此帧的时候,查看源地址(S76网关),并将它添加到MAC地址表中,但是设备并不知道机顶盒在哪个端口上(MAC地址表中没有机顶盒的MAC地址),所以这个帧就是未知单播帧,设备交换芯片会泛洪这个帧,直到机顶盒MAC回应他所在端口, 然后以单播方式正常传输。异常情况下,由于现网中存在1.2k左右的MAC地址,使CB303A终端学习后出现溢出现象,当终端交换芯片学习超过其容量表项的MAC后,机顶盒的MAC不被交换芯片所学习,导致单播报文在交换芯片中以广播方式传输,并被终端的广播风暴抑制功能所抑制。
四、 解决方法:
1、这个问题是由于EPCN终端所在管理VLAN网络的MAC地址过多造成,过多的MAC在同一个二层下,会产生大量的广播导致网络传输效率低下,建议合理规划二层设备数量。
我司EPCN设备可以远程情况下修改管理VLAN和IP地址。方法:在WEB页面向导:系统管理→管理接口,同时更改管理VLAN和IP地址。
注意:CC600E需要升级到V100R010及以后版本;CC620E需升级到V100R002及以后版本;CC720E需升级到V100R002及以后版本;CC600可通过远程导入配置文件进行修改;
2、将每个汇聚层设备,例如S76,S75E或S65划分一个管理VLAN,修改OLT上端的配置,在OLT上做端口隔离。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作