当前位置:首页解决方案高校解决方案

校园网网络性能分析(NPM)解决方案发布时间:2020-05-21 16:58

 

NPM产生背景

随着网络不断发展,现有网络更多面向的是基于网络层面的性能感知,能看到的仅仅是管道的质量和性能。但是仅看到管道是不够的,只有真正看到业务的性能情况,才有办法做优化和改善。
现网中存在的问题:
  • 业务质量无法实时监测,无法感知业务性能指标的异常
  • 当业务出现异常趋势时,现有运维手段无法分析预判进行主动干预
  • 对于网络及业务的指标缺乏针对性改善建议
  • 难以按月提供定制化业务质量报表或BOD
 
所以,基于应用感知的NPM就此诞生。

NPM应用价值

 
 
 
 
 
 
 









NPM的基本功能:

派网的NPM能够实现基于应用与协议的精确识别及性能管理能力
  • 采集及识别
  • 分析及报表
  • 告警及评价
 
不仅能看到是什么?还能看到发生了什么

NPM的核心技术:

  • 基于签名的深度包检测DPI
- 行之有效的识别技术
- 进一步演进为深度流检测DFI
  • 节点跟踪
- 共享识别信息
- 提高识别准确率和性能
  • 主动探测
- 探测源目的端状态
- 辅助分析节点特性

NPM核心功能:

 
深度:
  • 对比网络层性能检测系统,NPM检测的目标是应用,是业务。看到的更接近网络中实际发生的真相。
  • 对比业内其他的应用性能检测系统,NPM除了可以识别出应用协议数据结构,还能看到应用协议的交互流程。
 
 
广度:
  • 可以实现单个协议时延、抖动等性能指标在时间维度的查询
  • 可以实现多个协议和用户的交叉查询,监测异常情况。上报预警或告警
时实:
  • 可以实现业务性能指标的实时查看
  • 出了问题后,可以实现按需追溯,找到问题所在
 
 

NPM在高校中应用实例

高校典型组网形式:

网桥模式
 
 
 
 
 
 
 
 
网关模式
 

针对校内上网用户进行时延分析

  • 客户时延:PA到客户端的网络时延;
  • 服务时延:PA到服务器的网络时延;
  • 应用时延:应用会话上下行首包时间差;
  • 最大包长:会话上下行最大包的长度。
 

 单协议性能的在线测量

时延:
 
 
 
 
 
吞吐量
  • 协议在线测量: xx协议吞吐、时延等指标实时显示,丢包、抖动等指标可在线测量               
  • 劣化预警机制: xx协议的时延经常已超过阈值,数据存在丢包风险,上报丢包预警
  • 故障告警机制: 当发现xx协议持续丢包、带宽异常等现象,主动上报故障告警
  •  
 

多协议的联动能力

  • 通过长期记录多个协议的TOP排行情况,可以实时发现网络出现的异常和突发情况。
  • 当遇到异常和突发情况时,可通过查看单协议的相关信息,来追溯网络中真实发生的情况,对网络可能出现的危险进行预判和告警,从而防患于未然。
 
 

针对每一条信息会话,实时查看,按需追溯

针对“大逃杀”游戏进行流量分析,可以查看到时延信息,从图中可知从用户到Panabit网关时延较短,属于正常范围,而服务时延和应用时延均较大;
针对“优酷”的流量进行分析,可以查看到时延信息,从图中可知第一条会话信息的应用时延较大,问题应该出现在优酷服务器本身;
 
 
 

 
针对外网访问校园服务器延时分析,客户时延较大,又由于这是从外向内进行访问,所以问题应该为实际使用客户至Panabit网关之间的网络延迟较大;
 
 

校园网排障思路举例:

问题现象:
2018年6月29日学生反应网页访问慢
NPM排查过程:
学校机房管理员通过NPM进行故障定位
1、追溯当时记录的NPM日志
2、首先,通过记录的HTTP上网等协议的URL信息,可以判断网络连接性无异常。
3、其次,通过已记录的TCP三次握手延时信息,可判断网络收发是正常的。
4、最终,通过与上周日志记录的HTTP协议重传率信息,进行对比判断。发现在6月29日,HTTP重传率超过日常平均值的50%,本故障定位为应用异常。