监控系统实况问题定位案例
监控系统各种业务问题中,实况类的问题通常是最多的,办事处或代理商工程师遇到用户反映视频卡顿、黑屏问题往往会不知从何处入手解决。本文对常见的实况问题进行分类,针对每一类问题结合典型案例介绍介绍,帮助现场工程师建立实况问题处理的思路。
解决实况问题,首先要了解实况的流程:
l 客户端选择某路视频进行实况点播
l VM向接收端发送SIP INVITE请求,邀请接收端接收视频
l VM判断是否经过MS,如果经过MS转发,则向MS发送请求
l VM向EC发送SIP INVITE请求,邀请发送源发送
l 监控关系建立后,EC根据协商结果,采用组播发送、或MS转发、或单播发送到接收者。
l 多级多域组网中,域间实况的流程增加了上级域和下级域的VM之间交互的流程,其余流程和单域类似
在上述流程中,我们可以看到每一个环节出问题,都会导致实况不成功。实况问题根据现象可以分为如下几类:
l 窗格没有变化
l 窗格显示视频丢失
l 图像显示异常
l 窗格黑屏
l 图像卡顿
l 图像出现条纹
下面小节分别对这几类问题进行分析,并介绍解决方法,实际的局点中如果遇到实况类问题,可以首先根据现象看属于上述哪一类,然后按对应方法处理。本文中的MS既包含MS8500服务器也包含具有媒体转发功能的VX500以及ISC3000-S。
窗格没有变化,是指拖动摄像机到窗格后,窗格仍然维持“NO VIDEO”,没有任何变化。此类问题通常属于信令层面的问题。
故障现象:
报“新建会话超时,错误码4643”
故障原因和解决方法:
1) 网络问题
在VM上ping EC、DC/XP查看是否正常;抓取VM上的SIP报文,查看SIP报文交互是否正常,有无丢包,有无重传。
解决方法:如网络原因导致信令报文丢失,请排查网络。
2) 域间通信问题
请检查配置的端口、地址是否正确。外域添加中一般情况下DA的端口为5091、V3域为5061、V1域为5060。
解决方法:如配置错误,请修正配置。
3) 设备离线
检查编解码器是否离线,或是在保活期内服务器没有感知到离线。如果使用MS转发,则还需要检查是否设置为“指定MS”,如果设置指定MS,当指定的MS离线时,也会造成实况建立超时。
解决方法:待设备上线后重试。
故障现象:
报“请求资源已占满”
故障原因和解决方法:
1) EC超单播规格
检查EC是否工作在单播且无MS转发的模式,此时,一个通道最多只能发送4路单播,网络中同时有超过4个WEB客户或DC单播点播同一路视频,会报此错。
解决方法:配置使用组播发送,或在系统中增加MS进行转发。
2) MS超规格
如果系统中使用MS进行转发,则需要检查是否超过MS服务器转发规格限制,如果超过规格则会报错。
解决方法:增加MS,实现负载分担。
故障现象:
报“编码格式不匹配”
故障原因和解决方法:
1) 硬解时候,EC和DC编解码套餐格式不一致
解决方法:检查EC和DC的套餐选择是否一致,如果不一致,请设置相同的流套餐。
窗格显示视频丢失,是指拖动摄像机到窗格或监视器后,窗格可以显示OSD信息,但是没有图像,有“视频丢失”闪烁。此类问题通常和摄像机与编码器的连接有关,此类问题建议采用交叉验证即替换法进行排查。
故障现象:
该摄像机视频显示“视频丢失”,更换其他摄像机,视频显示正常。
故障原因和解决方法:
1) 摄像机故障
解决方法:更换摄像机。
故障现象:
该摄像机视频显示“视频丢失”,更换视频线后视频正常。
故障原因和解决方法:
1) 摄像机和编码器之间的视频线缆故障
解决方法:更换视频线缆,或检查视频线缆接头是否存在虚焊或连接断开,可以通过重新安装BNC接头解决。
故障现象:
该摄像机视频显示“视频丢失”,更换编码器的输入BNC接口,或接到另外一台编码器后视频正常。
故障原因和解决方法:
1) 编码器BNC接口损坏
解决方法:对编码器进行备件更换。
图像显示异常,包括图像色彩失真、质量较差、图像边缘被截掉等问题。
故障现象:
图像质量较差,颜色失真。
故障原因和解决方法:
1) 饱和度、对比度、亮度、色度参数设置有误
解决方法:检查饱和度、对比度、亮度、色度参数,默认情况下使用128即可。
当图片整体偏暗或偏亮可以适当调节亮度,亮度不是越亮越好,亮度太高会失去一些色彩成分,调整亮度的同时需要同时调整对比度,否则图像会整体发灰;当图像不是很鲜艳可以适当调节饱和度,饱和度也不是越高越好,饱和度太高可能会引入色斑;色调在监控中通常不需要调节,因为色调的调整势必会引起颜色失真。
2) 分辨率、码率设置不当
解决方法:检查编码器通道的分辨率和码率参数,对于分辨率为D1的通道,如果设置分辨率为CIF,势必会导致图像达不到应有的清晰效果。同时,在带宽允许的情况下可以适当的加大码率,如果码率设置过低,会使得图像丢失一些细节。
故障现象:
图像显示异常,更换摄像机没有该问题。
故障原因和解决方法:
1) 摄像机故障
通过替换法确认该摄像机故障,如果不方便替换,可以参照《抓取编码前的图像》案例,抓取编码器接口收到的编码前的图像,如果编码前图像显示同样异常,则基本可以定位为摄像机的问题。
解决方法:更换摄像机。
故障现象:
图像显示异常整体发亮或发暗,更换摄像机无法解决,调整视频参数也无效,更换编码器或替换该编码器的另一个BNC接口后无此问题。
故障原因和解决方法:
1) 编码器BNC接口故障
使用外用表检测编码器BNC接口的阻抗,如果不是75欧姆且偏差较大,说明BNC接口故障。
解决方法:对编码器进行备件更换。
故障现象:
图像边缘被截掉一部分。
故障原因和解决方法:
1) 高清VGA输出或老式CRT显示器输出图像
高清VGA输出或老式CRT显示器输出图像可能会对图像边缘进行裁剪,导致图像显示不全,OSD显示不全。
解决方法:如果需要显示完整的视频,则需要更换显示设备,如果只需要显示完整的OSD,则可以通过调整OSD在屏幕上的坐标位置解决。
故障现象:
图像一会显示一路图像,一会显示另外一路,看起来像在同时显示两路图像。
故障原因和解决方法:
1) 组播地址配置重复
网络中有两台编码器配置相同的组播地址,当这两路视频均被点播时,网络设备会建立组播转发表项,但是由于接收端通常支持的是IGMPv2,只会指定接收某组播组的数据,而不会指定组播源,所以两台编码器的图像均会发送到接收端,造成显示异常。
解决方法:检查配置,保证系统中每台编码器、每个通道的组播地址均不可重复。
黑屏是指,拖动摄像机到窗格或监视器后,窗格没有任何显示,包括OSD和“视频丢失”。黑屏问题说明信令层面交互已经完成,窗格准备显示视频,但是没有显示出来。根据流程分析,可能原因包括,网络问题、MS转发问题、数据包格式问题、显卡显示问题几类。
故障现象:
没有MS的情况下,编码器发流,但接收者没有收到流;有MS转发的情况下,编码器发流到MS,但MS没有收到流,或MS收到流并正常转发,但是接收端没有收到流。
故障原因和解决方法:
1) 网络不通
网络路由不通,使得EC发送的视频流无法到达MS或DC/WEB。
解决方法:检查EC和WEB/DC以及MS之间的网络,确保设备间能互相ping通。如果网络不通,请排查网络路由。
2) 网络中存在防火墙
EC和MS以及DC/WEB之间能ping通,但是网络中或接收端开启了防火墙,并且设置策略拒绝了UDP视频流通过,造成黑屏。
解决方法:关闭防火墙,或修改策略允许监控视频包通过。
3) 三层网络不支持组播
网络中使用组播发送视频流,并且跨越了三层网络,但是网络没有正确配置组播。
解决方法:在三层设备上配置IGMP和PIM SM,并且通过display multicast routing table和display igmp group查看组播的表项正常建立。
4) 网络丢包严重
网络丢包严重,导致视频流中I帧丢失,导致解码端无法解码而黑屏。
解决方法:排查网络。
故障现象:
使用MS转发,MS接收到EC发送的视频流,但是没有正确转发。
故障原因和解决方法:
1) MS没有设置默认路由
MS收到媒体流后根据转发表项要修改媒体流的源地址和目的地址并进行转发,转发时需要根据目的地址(DC/WEB的地址)查本地路由表,确认下一跳及出接口,如果由于某些原因导致MS默认路由被删除,MS找不到报文的下一跳和出接口,则MS会丢弃报文,造成接收端黑屏。
解决方法:通过route print命令查看MS的本地路由,查看默认路由是否正确。如果默认路由丢失或不正确,请为MS添加正确的默认路由。通常情况MS只使用一个物理网口,假设为ETH1口,则添加和删除默认路由的命令可以参考如下命令:
route add -net 0.0.0.0 netmask eth1
route del -net 0.0.0.0 netmask eth1
如果设置路由正确,仍然无法解决问题,请收集MS的systemreport信息反馈给二线。
故障现象:
在接收端抓包可以抓到报文,但是图像黑屏且窗格下方统计显示码率为0。
故障原因和解决方法:
1) 报文源地址错误
在编码器发送视频流之前,VM和EC、VM和客WEB/DC会通过信令协商视频的源/目的地址和源/目的端口,当接收端收到视频流后会检查视频的地址和端口是否是自己需要接收的。通常如果报文的源地址或目的端口和期望接收的流不一致,接收端就会丢弃该视频流。例如:当EC在NAT私网侧,WEB在NAT公网侧,EC私网地址为10.1.1.1,NAT后的公网地址为1.1.1.1,而VM通知WEB接收的视频流的源地址为EC的私网地址,当视频流经过NAT到达WEB后,WEB发现源地址为1.1.1.1而非10.1.1.1,会认为该流为非法流,因此丢弃,造成黑屏。
解决方法:检查网络中是否存在WEB在公网,而EC/VM在私网的NAT组网,此种组网当前版本不支持,需要调整。当前支持WEB在私网,而EC/VM在公网的组网。或者使用VPN的方式解决该问题。
2) 报文目的端口错误
检查是否是v3上级域v1下级域的组网,此时如果下级域没有MS,请检查上级域的外域设置中,确认引流标志为“是”。否则可能会出现视频流目的端口和信令协商端口不一致导致WEB丢包,黑屏。
解决方法:上级域v3外域设置,确保引流标志为“是”,或在下级域增加MS。
故障现象:
黑屏,但是收包统计可以看到码率不为0,丢包率为0。
故障原因和解决方法:
1) WEB一路图像都无法显示
解决方法:确认显卡硬件加速启用,建议使用ATI X1550(及以上)或NVIDIA GF 7300LE(及以上)显卡芯片的256M以上显存的主流独立显卡,硬件支持DirectX 9.0c。检查驱动版本,更新到最新版本。检查桌面属性->设置->疑难解答中的硬件加速是否设置为最大,如没有将它设置为最大。
通过"运行" dxdiag,弹出directX的配置界面,判断显卡和显卡驱动,如果XP启用的是高品质,则要求Direct3D已启用;显卡的颜色管理部分设置为“最高(32位)
2) WEB显示多路视频后,新调用的窗格黑屏
由于显卡性能,可能导致WEB无法同时播放16路或25路视频。
解决方法:同上述问题进行排查。
图像卡顿通常是由于网络原因造成的,包含网络丢包,存在乱序。硬解图像在卡顿的同时可能会伴随花屏的现象。
故障现象:
卡顿,抓包分析有丢包。
故障原因和解决方法:
1) 网络带宽不足
视频流码率超过网络提供带宽,造成丢包。需要注意编码器使用的是上行带宽,对于像ADSL等上下行非对称的链路,需要确认上行带宽是否满足要求。
解决方法:降低码率,增加网络带宽。
2) 视频流存在突发
网络带宽足够,但是视频流突发较大,造成丢包。
解决方法:在EC上开启码流平滑,同时在DC上开启缓存,在WEB上将处理模式调整为“流畅性优先”。如果网络中存在低端交换机,将低端交换机的缓存模式打开,命令为burst mode enable。
3) 二层组播配置不当
网络用到二层组播,但是组播配置不当,形成广播,占用网络大量带宽,造成丢包和视频卡顿。
解决方法:当网络使用二层组播时,要在网络设备上配置IGMP-SNOOPING,如果网络是一个纯二层的网络,则还需要在核心设备上配置IGMP-SNOOPING查询器。配置后还需要通过display igmp-snooping group确认二层组播转发表项正确建立。
4) 光电转换器问题
网络中用到了传输设备,存在光电转换器,某些光电转换器传输视频流时会造成丢包。
解决方法:如果通过替换法,不经过光转,或更换光转后问题消失,即可定位为光转的问题。该问题通常可以通过更换光电转换器解决。
故障现象:
卡顿,抓包分析没有丢包,但存在乱序。
故障原因和解决方法:
1) 网络存在防火墙
排查网络是否存在防火墙,抓包分析防火墙的输入和输出包,防火墙的策略可能会导致报文经过防火墙后乱序。由于实况流为UDP流,乱序会导致接收端无法组包,而造成丢包。
解决方法:对于我司防火墙,升级版本到R3166P10可以解决乱序问题。
2) 网络存在捆绑链路
网络存在捆绑链路,可能会导致报文乱序,造成接收端解码丢包。
解决方法:在路由器上开启队列功能,在在MP-group接口下增加接口fifo队列大小和MP排序窗口的大小,以保证减少乱序和丢包的情况。
故障现象:
卡顿,抓包分析没有丢包。
故障原因和解决方法:
1) 编码器设置码流平滑,但接收端没有开启缓存
编码器设置码流平滑是为了减少视频流的突发,将突发流量分为多个报文平滑发送,因此增加了报文数,在接收端必须开启缓存,对于WEB则必须设置为流畅性优先模式。
解决方法:DC开启缓存,WEB设置流畅性优先模式。
故障现象:
WEB卡顿,网络正常。
故障原因和解决方法:
1) WIN7或VISTA问题
WIN7或VISTA开启Multimedia Class Scheduler服务,使得CPU使用率过高,造成客户端视频卡顿。
解决方法:
A、打开注册表,查找到
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet
\Services\Audiosrv
在右侧窗口中找到并双击“DependOnService”
删除“MMCSS”。
重启电脑。
B、开机后,右击“我的电脑”--->"管理” ---->"服务和应用程序" ---->"服务", 找到服务
“Multimedia Class Scheduler”。
停止该服务即可;
如果想永久生效,禁用该服务。
出现条纹发虚通常是由于模拟信号受到干扰导致。
故障现象:
图像出现条纹,图像整体发虚。
故障原因和解决方法:
1) 模拟信号受到干扰
模拟信号受到干扰,在显示端会出现图像发虚或图像有条纹。如果现象持续出现,可以在编码器上抓取编码前的图像,判断如果编码前的视频已经存在条纹和发虚,则可以判定是输入信号已经收到干扰。如果条纹现象是规律性偶发的,则需要了解一下摄像机所处位置的视频线和电源线的连接走线情况。之前遇到过电梯间的摄像机,当电梯运行时会产生干扰,而停止时图像正常。
解决方法:查看摄像机的视频和电源走线,保证接地。
对于网络发生丢包,需要确认在哪一段网络丢包,可以采用逐段抓包的方法,从EC到接收端的网络设备上逐段抓包。需要重点关注的是存在光电转换的链路、EPON链路、防火墙的链路。
抓包建议使用最新版本的Wireshark软件,通过下属步骤操作:
l 通过抓包工具抓取一段视频码流,必须为唯一的一组视频的码流,否则需要通过流包的源和目的地址、端口进行过滤,过滤出唯一一组视频的码流。
l &&***.***.drop,然后在过滤命令后面加上这段字符。如果过滤出报文就说明有丢包。否则,正常。
mp2t就是指mpeg2协议的ts流。cc指1-15的序列号。
还可以将这段数据包进行过滤,过滤出ts包,转成ts文件,在WEB上播放,检查丢包率。
l 找到视频的端口,根据端口过滤出制定的报文。
l 使用wiresShark工具的下面功能,将udp+ts的媒体流保存成ts文件。
l 使用MPPV3界面登录,点击“播放本地录像”,选择刚才保存的ts文件,播放查看丢包统计
遇到实况类的问题,如果按照上述方法排查仍然无法定位,则请:
l 登录EC的web界面,在业务设置界面,将EC通道发流界面截图
l 抓取视频流报文,根据上节内容,如有条件进行逐段抓包
l 对于卡顿问题,请录一段本地录像
l 对于WEB可以抓到包,但是现实黑屏的问题,也收集录一段本地录像,并抓拍一些照片
l 收集WEB端的控件安装目录中的log文件,通常位于C:\Program Files\H3C\ActiveX\log,把整个文件夹拷贝出来
l 收集版本信息
将上述信息反馈给监控二线定位分析。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作