ftp服务器作为网络传输环境中的重要组成部分,很多ftp传输的本身就是非常重要的业务数据,如果传输质量打折将会直接影响到业务的效率。本章节将通过讲述在同一网络中因未知因素影响ftp传输效果的案例,以及如何排查发现传输故障的根源。
近期,某公司aix服务器间在ftp传输oracle数据库备份xxxx.dmp文件的时候,有台服务器ftp传输质量极不理想,远低于其他服务器之间的传输速率。
如下方网络拓扑图所示:ftp client1、client 2及client 3作为client均与ftp server传输相同的xxxx.dmp文件时,ftp client1及client 2速率比较理想,但 ftp client3速度较慢,用时大概是ftp client1与client 2的40-50倍,严重影响了正常的业务运行。因此,数据捕获点位设置为汇聚层cisco n5k交换机。
ip地址分别为:
ftp server:x.x.96.180
ftp client1:x.x.96.160
ftp client2:x.x.195.20
ftp client3:x.x.195.70
图 6-1
将ftp client1及client 2的ftp传输流量定义为正常流量, ftp client3的ftp传输流量定义为异常流量,然后进行流量回溯分析。从宏观上观察,可以了解到当传输几个gb的xxxx.dmp大文件时,ftp client1及client 2的速率维持在140mbps左右,而ftp client3则只能达到10mbps左右。
是什么造成传输速率有如此大的差异呢?需要进一步分析!只需要截取ftp传输前期短暂时间内的流量进行解码,对比分析正常流量和异常流量:
从三次握手建立连接到传输数据,两者的数据都是相近的,没有明显差异,如下图所示。
图 6-2
但是,通过对比分析,发现同一时间段内,异常传输和正常传输之间的比特率差距很大。ftp client2没有出现重传现象,而ftp client3却多达40次。这些重传均是ftp server发往ftp client3的单方面数据包,占比0.543%,虽然数据包基数很小,但一次重传需等待近1.2 s时间。由此,时间叠加使得传输时间变长,造成同样文件的ftp传输,ftp client3传输速度却很慢,如下图所示。
图 6-3
再将这段时间内的流量进行可视化分析,可以发现异常流量传输质量始终不高,而正常流量则能够达到高效传输。异常传输的图形是由于重传所造成拥塞机制而造成传输效率不能提升,如下两图所示。
图 6-4
图 6-5
另外从时间序列上判断,接收窗口始终保持在较高水平,异常流量的tcp序列号在缓慢增长。与相隔一段时间数据包出现重传也正好吻合。
图 25-6
此次ftp传输故障是由于ftp server xx.x.96.180发往ftp client3 xx.x.195.70的数据包单方向重传造成的。因为该网络环境是多台n2k交换机进行虚拟汇聚,可以理解为同一交换机。而捕获的流量相当于ftp客户端、服务器之间直连设备的流量,因此,在服务器和客户端两端都正常的情况下,只能是中间线路的性能问题。
通过交换机查询接口光纤衰减,发现连接ftp client3和交换机的光纤存在很大的衰减,该衰减和ftp client1及client2相应位置的光纤衰减不是一个量级的。经检测,这段光纤有损坏,通透性显著降低。客户更换良好光纤跳线后, ftp client3的ftp传输文件速率明显提高,与ftp client1及client 2的传输文件速率相近,客户使用体验良好。
当网络中出现通信传输异常时,尤其是同一网络环境中,不同设备传输速率差异较大的情况,由于经过的网络节点基本一致,如果不能够对故障进行深入到数据包级的可视化分析,运维人员将很难精确定位问题根源。通过网络流量分析技术,可实现对故障问题的深入分析,及时发现传输异常的原因,并且能够快速定位故障节点,使运维人员依据分析结果对相应设备进行优化设置,可快速解决此类问题,将损失降到最低。