小虎是我司资深的技术工程师,某天一位运营商客户打电话给其诉苦说:”最近我们的网络感觉很不稳定,尤其是一些基于TCP连接的应用更是比较明显,感觉丢包很严重啊。哎~可是具体哪段线路不稳定我又不清楚,想排查呢又不知道如何去进行,真是让我忧心忡忡啊!”,小虎听后果断给客户推荐了我司专门用于网络连通性诊断的管理软件IMC SHM组件,并详细向客户介绍了一番:链路丢包严重,我们可以发送各种不同类型的NQA探测报文去逐跳探测哪段链路转发有异常,并且呢这些工作都是自动化进行的不用我们去设备上配置繁琐的命令,最重要的是探测的结果还能够以汇总报表的形式直观清晰的展现在iMC页面上,给问题排查提供重要的参考。客户听后连连称好,可是随即又提出了疑问:“这么强大的功能使用起来会不会很麻烦呀!“小虎自信的回答道:”不但不麻烦,而且配置过程逻辑很清晰,界面也很友好,您一定会觉得好用的。下面呢我就给您举个例子来简单说明一些吧!“
如下图1-1所示是一个简单的网络模型,我们怀疑从SW10.1.1.254到RT192.168.1.2之间的网络不稳定,所以构造不同类型的报文在其间转发来对链路质量进行检测。
利用ICMP探测报文来检测其三层的连通性
图1-1
第一步,使能SW10.1.1.254和RT192.168.1.2的客户端和服务器端状态。
说明:在NQA探测过程中,发送NQA报文的一方称为客户端,接收报文的一端称为服务器端。比如本例需要从SW10.1.1.254发送NQA报文到RT192.168.1.2,那么SW10.1.1.254即为客户端,RT192.168.1.2即为服务器端。为了后续增加更多探测的方便,我们这里既使能设备的客户端状态,也使能设备的服务器端状态,也即设备既可以作为探测方,也可以作为被探测方。
1.登录iMC进入【业务/服务健康管理/NQA配置/NQA设备】页面,点击设备名称后”修改“列中的齿轮按键,如下图1-2所示:
图1-2
2.在跳转后的界面,设置服务器端状态使能和客户端状态使能,如下图1-3所示:
图1-3
第二步,增加NQA种类
说明:NQA种类是由一个或多个基本测试指标组成的集合,设置NQA种类后管理员可以从多个方面度量链路的质量,体现出不同类型服务对链路质量要求的差异性。
1.进入【业务/服务健康管理/NQA配置/NQA种类】页面,点击增加来自定义一个NQA种类,如下图1-4所示:
图1-4
2.在跳转后页面中输入NQA种类的名称,点击“指标信息“栏中的”增加“来为此NQA种类选择基本测试指标,如下图1-5所示:
图1-5
3.在弹出窗口中选择指标”ICMP Echo“,如下图1-6所示:
图1-6
第三步,增加NQA等级
说明:NQA等级主要包含NQA基本信息和阈值信息,阈值信息是衡量所提供服务的重要标示,当NQA等级被下发的NQA实例引用时,一旦NQA的采集结果超过所引用的NQA等级中定义的阈值范围,系统将根据告警策略触发相应告警。
1.进入【业务/服务健康管理/NQA配置/NQA等级】页面,点击”增加“来自定义一个NQA等级。如下图1-7所示:
图1-7
2.在跳转后页面输入NQA等级名称,并设置各项指标的阈值范围,如下图1-8所示:
图1-8
第四步,增加NQA实例
说明:增加NQA实例即给网络设备下发实际的探测指令。根据探测需求指定源设备和目的设备,选择源设备时需要指定报文的源发送IP和源发送端口。NQA实例必须属于某个NQA分组,所以需先新建NQA分组。
1.进入【业务/服务健康管理/NQA实例】页面,点击”增加分组“如下图1-9所示:
图1-9
2.在跳转后的页面输入NQA分组名称及可访问其的操作员分组。如下图1-10所示:
图1-10
3.创建好分组后点击”增加实例“来新建实例,如下图1-11所示:
图1-11
4.在跳转后的页面输入NQA实例名称,所属的NQA分组,并选择所要引用的NQA等级名称和NQA种类名称。如下图1-12所示:
图1-12
5.点击“下一步“后选择源设备和目的设备,并指定源IP地址和目的IP地址,如下图1-13所示:
图1-13
6.点击”下一步“后设置实例执行时间和采集周期等信息,如下图1-14所示:
图1-14
7.完成后即可看到所增加的NQA实例下发成功,正在采集数据中。如下图1-15所示:
图1-15
第五步,查看诊断结果
说明:NQA实例下发后SHM后台会以固定周期发送NQA探测报文检测链路连通性,并记录采集结果。通过采集结果可以确定某段时间内测试段报文的转发情况。
进入【业务/服务健康管理/NQA实例】页面,点击实例名称后“操作”列的报表图标,即可看到链路诊断的结果信息,如下图1-16所示:
图1-16
上述部分通过ICMP报文的转发对链路进行了诊断,接下来通过TCP报文的转发对链路的质量进行诊断评估。
第一步,增加TCP连接服务器
说明:部分基本指标(TCP、UDP-echo、UDP-jitter、Voice)在进行测试前,必须在目的端设备上配置NQA服务器,用于响应NQA客户端发送到指定IP和端口的探测报文。这里我们探测TCP指标,所以增加一个TCP连接服务器。
1.进入【业务/服务健康管理/NQA配置/NQA设备】页面,点击设备名称后“修改“列的T字按键,如下图2-1所示:
图2-1
2.在弹出页面中点击”增加“并设置TCP Server地址和端口,如下图2-2所示:
图2-2
注:由于基本指标”TCP Connection”中默认的TCP端口为7,所以这里的端口必须设置为7,也即是目的端设备以端口7和源端设备建立连接。
第二步,增加NQA种类
1.在【业务/服务健康管理/NQA配置/NQA种类】页面点击“增加”如下图2-3所示:
图2-3
2.在弹出页面输入NQA种类名称并选择所要引用的基本指标,如下图2-4所示:
图2-4
3.在弹出窗口中选择指标“TCP Connection”,如下图2-5所示:
图2-5
第三步,增加NQA实例
1.在【业务/服务健康管理/NQA实例】页面点击“增加实例”,如下图2-6所示:
图2-6
2.在跳转后页面中输入NQA实例名称及其所属分组,并选择所要引用的NQA种类和NQA等级,如下图2-7所示:
图2-7
3.点击“下一步”后输入源设备和目的设备,并设置源地址和目的地址等信息,如下图2-8所示:
图2-8
4.点击“下一步”后选择实例的执行时间和采集周期等信息,如下图2-9所示:
图2-9
5.完成后即可看到配置的NQA实例下发成功,正在采集数据中。如下图2-10所示:
图2-10
第四步,审计诊断结果
1.进入【业务/服务健康管理/NQA实例】页面,点击实例名后“操作”列中的报表图标,即可查看诊断结果信息。如下图2-11所示:
图2-11
2.当诊断结果超过了NQA等级中设置的阈值时,iMC会产生相应的告警以提醒管理员注意。进入【告警/实时告警】页面即可看到,如下图2-12所示:
图2-12
通过以上两方面的探测,已经能够清楚的展示SW10.1.1.254到RT192.168.1.2之间网络的连通性和对TCP报文的转发处理质量。SHM强大的功能和友好直观的展示界面给客户留下了深刻的印象,客户满意地称道:“网络诊断哪家强,SHM真是好!”
1. SHM对设备的配置下发是通过SNMP协议进行,所以务必保证设备开启SNMP读写团体字,并且iMC上配置的访问参数正确;
2. 基本指标作为SHM诊断的最小单位,其只能修改不能增加;
3. 一个NQA种类下可以引用多个基本指标,多维度反映此链路质量;
4. NQA实例的下发实际上是对设备进行NQA探测配置,所以要求设备支持NQA特性。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作