案例背景
某银行用户反映银行网银系统有时访问较慢,主要现象为打开登录界面需很长时间,银行客户希望能对网银系统做一个全面的分析,找出故障的原因。
网银系统的网络环境拓扑示意图如下:
图 1 网银系统网络拓扑图
客户端访问网银系统外网地址,然后经过F5负载均衡设备转发数据,直接访问SSL加密设备,再通过SSL设备转发给网银系统WEB服务器。
本案例选择在网络出口以及SSL加密设备出口进行部署科来网络回溯系统进行抓包分析。
案例分析
结合网银系统网络拓扑及数据的走向,网银系统访问较慢的原因有以下几点:
- 网银系统访问流量太大,出口链路拥塞;
- 网络响应延时较大;
- 网络设备转发故障;
- 网银服务器本身响应较慢。
1、整体流量分析
对1小时内网银系统外网出口流量进行统计,总流量为919MB,峰值流量为5Mbps,平均流量为2.2Mbps。
2、网络延时分析
在TCP的连接过程中,客户端和服务器端在网络中共传输三个数据包,俗称三次握手,这三个数据包都是小包,没有实际有效数据载荷。服务器端对客户端TCP SYN的请求在系统底层响应,响应非常快,该响应同数据包在网络中传输的延迟比可忽略,同时由于都是小包,网络传输延迟非常小,因此在数据包分析中可以通过三次握手数据包的时间间隔来确定网络的传输延迟。
随机选择系统外网出口多个完整的TCP会话,通过对TCP三次握手时间进行分析,发现服务端在收到客户端的三次握手时间基本在50ms左右,这在互联网环境中属于比较短的延时,说明网银系统内部网络和互联网链路延时都很正常,网络延时并不是造成系统访问缓慢的原因。
3、网银系统性能分析
对外网出口流量进行分析,重点分析持续时间较长的TCP会话,发现部分会话存在异常。如下图:
通过TCP交易时序图可以看出,服务端在对客户端的第一个请求进行确认后,经过了7秒才发出了响应数据包。这段时间应该就是导致客户端访问网银系统缓慢的直接原因。
为了确定这个延迟产生的具体原因,分析SSL加密设备进出数据,找出相同源IP的TCP会话数据进行对比,发现在SSL加密设备出口处同样出现服务器端在很长时间后才发出响应数据。
外网出口出现的故障现象在SSL加密设备出口同样存在,证明这段延迟不是在SSL加密设备之前产生,F5到SSL加密设备之间的网络正常。
进一步分析SSL加密设备和网银服务器交互数据,由于这部分数据是没有进行加密传输的,因此无法准确定位到之前分析的同一个TCP会话。而通过对大量TCP会话的对比分析,发现SSL加密设备和网银服务器之间的数据传输很快,所有会话都是在1S之内完成,基本不存在响应延时情况。
根据SSL协议规范,服务端发送的一个数据报文应该是服务器数字证书等加密通讯的握手报文,SSL加密通道的建立过程应由SSL加密设备处理,因此我们基本可以判定由于SSL加密设备造成了网银系统访问缓慢的原因。
结合故障数据包分析,可以发现出现延时的数据包是由SSL加密设备向客户端响应的Server hello数据包,因此更加可以肯定SSL加密设备就是造成故障的根本原因。
分析结论
通过以上信息,我们可以做出如下判断:
- 链路流量值不大,流量趋势稳定,没有明显的递增或递减趋势,监控链路不存在持续性拥塞问题;
- 网银系统内部网络正常,网络延时很小;
- 网银系统访问缓慢,应该是由于SSL加密设备和客户端进行密钥交互时,SSL加密设备响应延迟导致。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
相关推荐
-
科来:利用网络分析技术分析航空客服系统故障
某航空公司华南客服中心,客服人员用客服系统接电话时经常出现接听失败的现象,由于客服服务器位于北京数据中心,中间涉及的网络设备较多,一直未能定位到故障原因。
-
科来:基于网络分析技术的丢包分析案例
近日接到某公安机关信息中心电话,反应整个公安系统传输数据丢包。虽然个机房内网络通信正常,但是办公区域都访问服务器都会丢包。导致视频会议传输不正常,严重影响正常办公。
-
利用网络分析技术解决VPN异常中断故障
某保险公司北京总公司与各地分公司均通过双线与当地电信和联通两大互联网运营商相连,各地分公司通过IPsec VPN接入总公司内部网络。
-
利用网络分析技术诊断BOSS系统故障
某运营商Boss系统向服务器提交订单,每天会有600个左右不成功的订单,不成功的订单需手工录入,极大的影响工作效率;该情况已持续2-3个月。