机场广播网呼叫器频繁重启问题处理典型
案例分析
一、 组网:
客户组网拓扑示意图如上。
二、 问题描述:
客户反馈机场广播网部分手持呼叫器终端同时出现不能使用的情况。并且在把连接手持呼叫器的交换机重启之后,业务恢复。出问题的呼叫器主要集中在红色区域的S5120EI上。
三、 过程分析:
为了有利于大家对机场广播网的特殊性有所了解,我们先补充一些关于机场广播网的基础知识。
1. 广播网系统流程介绍
机场公共广播系统采用集中管理、分散控制的体系结构,基于以太网技术,所有系统设备或直接或通过接口设备连接于广播系统LAN 中,控制信号传输基于TCP/IP 协议,音频传输采用CobraNet 协议,数字音频信号为实时、无压缩数字音频信号流,采样频率采用48KHz,量化为16bit/20Bit,是一个多语言实时的公共广播系统。机场航站楼公共广播系统主要由系统控制设备、现场设备、音源设备、外部接口和通讯线缆组成。系统控制设备包括:ACS 音频矩阵、系统管理服务器(与航班自动广播服务器合并)、系统管理工作站、广播控制工作站、、功率放大器系统、网络音频输入/输出接口设备、网络设备等组成,音源设备包括:人工广播站,现场设备包括扬声器、噪声探测器、音源选择和音控开关面板等,系统外部接口包括与SI 的接口、与消防系统的接口、与时钟系统的接口等。通讯线缆包括扬声器回路线缆、呼叫站回路线缆(包括光电转换设备)、噪声探测器回路线缆以及网络通讯线缆。其中网络通讯线缆(6 类线、光纤)由综合布线系统完成。
广播系统流程图
1) 自动广播流程
航班动态信息从航显系统发送到集成系统,再由集成系统发送到广播的服务器上。广播服务器的自动广播程序根据从集成接收到的航班动态信息和广播规则自动匹配,生成对应的航班广播指令,发送到ACS矩阵。ACS矩阵收到指令后,检测对应功放回路是否空闲或者繁忙。当返回回路空闲指令时,合成对应的广播语句,发送到相应的功放回路。最后功放将声音输出到扬声器。
2) 半自动广播流程
广播客户端发送广播消息到广播服务器,广播服务器通过协议解析广播消息后,生成对应的航班广播指令,发送到ACS矩阵。ACS矩阵收到指令后,检测对应功放回路是否空闲或者繁忙。当返回回路空闲指令时,合成对应的广播语句,发送到相应的功放回路。最后功放将声音输出到扬声器。
3) 消防广播流程
当有消防报警时,消防系统发送干结点信号到广播的消防LVIO设备。消防LVIO设备收到指令后,转换为广播消息发送到广播服务器。广播服务器通过消防协议解析后,生成对应的消防广播指令,发送到ACS矩阵。ACS矩阵收到指令后,检测对应功放回路是否空闲或者繁忙。当返回回路空闲指令时,合成对应的广播语句,发送到相应的功放回路。最后功放将声音输出到扬声器。
4) 呼叫站广播流程
呼叫站将人工呼叫站广播请求转换为相应的广播指令,发送给ACS矩阵。ACS矩阵收到呼叫站指令后,检测对应功放回路是否空闲或者繁忙。当返回回路空闲指令时,呼叫站就可以播放音频到相应的回路。最后功放将声音输出到扬声器。
5) 内通广播流程
当有内通广播需求时,内通系统发送干结点信号到广播的内通LVIO设备。内通LVIO设备收到指令后,转换为广播消息发送到广播服务器。广播服务器通过内通协议解析后,生成对应的内通广播请求指令,发送到ACS矩阵。ACS矩阵收到指令后,检测对应功放回路是否空闲或者繁忙。当返回回路空闲指令时,内通相应音频信号通过ACS矩阵发送到相应的功放回路。最后功放将声音输出到扬声器。
6) 航显FCS广播流程
从航显系统发送FSC广播请求到集成系统,再由集成系统发送到广播的服务器上。广播服务器的广播程序根据从集成接收到的航显FSC广播请求信息和FCS广播规则自动匹配,生成对应的航班广播指令,发送到ACS矩阵。ACS矩阵收到指令后,检测对应功放回路是否空闲或者繁忙。当返回回路空闲指令时,合成对应的广播语句,发送到相应的功放回路。最后功放将声音输出到扬声器。
2. 工作原理
公共广播系统由自动广播服务器、系统管理服务器、ACS 数字音频矩阵、设备管理工作站、广播控制工作站、网络语音存储器、功放系统、广播呼叫站、扬声器系统、噪声探测器和音控开关等组成。系统设备通过广播系统以太网连接。在广播系统以太网中,利用CobraNet 协议进行音频流的传输及控制,构成CobraNet Vlan,利用TCP/IP 协议进行系统控制管理信息的交互,构建IEDNETTM vLAN,音频信号与控制信号分开传输,可以利用以太网的QoS 技术保证音频流的传输带宽,提高音频传输质量。
广播系统配置1 台自动广播服务器,安装IED FAS 自动广播软件和与SI 系统的接口软件,获取统一的航班信息,生成广播指令。自动广播服务器通过广播系统网络与数字音频矩阵系统ACS 连接,通过TCP/IP 协议传输自动广播指令给数字音频矩阵系统。数字音频矩阵系统根据接收的指令进行自动语音合成并通过数字音频矩阵的播放和路由控制,实现航班信息的自动广播。
系统配置1 套广播系统管理服务器,用于对广播系统的设备管理、功能设置,监视广播系统的运行状态。广播系统管理服务器采用TCP/IP 协议与广播系统连接,通过运行系统管理软件(IED ACS)与ACS 主机进行通讯。
数字音频矩阵配置录音存储转发卡,以实现对因为通道被占用或被更高优先级广播中断而未能即时播出的广播进行录音存储及重放播出功能。
系统可在必要的工作场所配置广播控制工作站,手动输入广播信息,实现半自动广播。
广播控制工作站运行半自动广播操作软件(IED CLIENT),可对广播内容进行编辑,生成广播指令,与自动广播服务器通过广播虚拟网络进行数据交换,控制广播系统实现半自动广播。
现场噪声探测器通过噪声收集接口机接入到广播系统中,将现场的噪声水平信息传递给音频矩阵,由音频矩阵将需要调整的区域信息发送到相应的功放,通过功放系统的分析和处理,调整功放的输出电平。
部分登机口广播呼叫站除数字网络接口外,另具有备用模拟接口,接入到本区的功放系统,在广播系统网络瘫痪时直接对本区广播。系统在机房内配置网络交换机、广播系统设备和网络功放系统,通过扬声器回路实现播音。功放系统采用8:1 的比例实现功放备份。
3. CobraNet协议
作为广播网里最重要的一个应用协议。CobraNet对报文转发的实时性要求非常高,协议交互报文中,尤其是心跳报文对时延有着明确的要求。
1) 心跳报文最大延时5ms(IDE厂家此标准为5.3ms)
2) 心跳报文最大抖动250us
在了解了广播网的特性之后,我们可以对此问题进行分析。
根据现场的故障现象来看,我们首先排查连接呼叫器的交换机自身是否存在问题。发现呼叫器不能使用时,连接呼叫器的端口存在频繁up/down的情况,但从交换机的诊断信息来看,并没有发现设备存在硬件或者软件问题。为了排除交换机端口本身故障,我们在连接呼叫器的端口挂接PC观察,发现连接PC之后,端口不会出现频繁up/down现象。这样就排除了设备本身问题的可能性。
进一步怀疑POE模块的问题,呼叫器采用的是外置的POE模块来供电,经过对POE模块的检测,也发现POE供电没有问题。在跟客户交流的过程中,我们了解到,两个矩阵服务器跟呼叫器之间存在心跳报文,呼叫器需要跟矩阵服务器之间进行心跳报文的交互,两台矩阵服务器之间是主备的关系,故障出现时,矩阵服务器B是master,而当master是矩阵服务器A时,基本不存在呼叫器中断的现象,由此我们想到,会否是心跳报文丢失导致故障,对经过交换机转发的心跳报文进行流统计发现,并不存在丢包的情况。为了进一步排查问题,我们把部分故障的呼叫器下挂到右侧NetGear交换机上,发现这部分呼叫器业务运行正常稳定。由此,我们怀疑是在链路中间产生了时延导致的问题,经过排查发现,在连接矩阵服务器B的HP交换机和S3600交换机之间是通过100M链路互联,虽然这个端口没有产生丢包,但是因为这样会存在多个百兆端口向打一个百兆端口打流量的情况,会导致拥塞,从而产生时延,导致呼叫器产生重启。
四、 解决方法:
根据我们的判断,对此100M链路进行扩容,将拓扑中红色的100M链路更换成1000M链路之后,呼叫器工作恢复正常。这个问题的原因比较隐蔽,在现场也费了很大周折才找出问题原因。此问题比较典型,希望提供给大家参考,有以下启示:
1. 要充分了解机场广播网的特殊性,其心跳报文对时延的要求非常高,在组网时就要考虑报文的时延问题,尽量减少拓扑的跳数。
2. 要注意STP TC报文对广播网的影响,因为收到TC报文,设备会删除MAC地址,导致报文在网内泛洪从而增加报文的传输时延,广播网中要尽量减少TC报文的影响。
3. 排查问题时,要注意去了解客户业务的特殊性,熟悉了客户业务流程,在定位问题过程中会少走弯路,有利于我们对问题的快速定位。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作