以下为《TCP协议KPI及汇总v1.0》的无排版文字预览,完整内容请下载
TCP协议KPI及汇总
修订记录
版本号
拟制人/
修改人
拟制/修改日期
更改理由
主要更改内容
(写要点即可)
1.0
黄某某
2013-8-15
初稿
1. 概述
TCP协议的所有指标请参考指标文档,本文旨在提出TCP协议的关键性能指标(KPI)和KPI的算法及关联。对一些KPI指标提出阀值或者合理值的范围。本文着重对KPI的阐述以及汇总计算,具体的展示由上层去处理。
对于汇总指标的展示,建议提供不同的视角去展示,比如可以提供全网视角、探针视角、用户组视角、服务器视角、客户端视角等。
比如:
1)如果选择全网视角,则把探针所测量到的所有数据的KPI指标进行汇总。
2)如果选择探针视角,则把该探针下所测量的所有数据的KPI指标进行汇总。
3)如果选择用户组视角,则把该用户组下所测量的所有数据的KPI指标进行汇总。
4)如果是服务器视角,可以根据服务器端地址做为测量对象进行KPI指标汇总。
5)如果是客户端视角,可以根据客户端地址作为测量对象进行KPI指标汇总。
根据不同的视角,汇总的算法对象会有一些差异,但是大体的方法都是类似的。以下汇总的算法只用一个视角(全网视角)来进行描述,其它视角可以类推。
tcp协议基本指标的汇总
在《tcp性能测量设计文档v1.0》中说明了tcp协议性能指标一共分为2张表输出,一张表是实时(周期性)的输出记录,另外一张表是tcp flow结束时输出的记录。
在《tcp性能测量设计文档v1.0》中,有具体说明基本指标如何汇总的方法,这里不再阐述。
2. TCP协议的KPI及汇总
2.1 三次握手时间
TCP三次握手时间是用客户端发送第一个ack的时间减去客户端发送的第一个syn报文时间。在我们测量中,有些tcp连接在测量前就已经建立了连接,因此,这类连接的三次握手时间就测量不到,在指标中,这个值为0。因此,在统计汇总中,我们只统计三次握手时间大于0的指标记录。
三次握手时间的汇总可以采用max、min、avg方式或者采用区间0-100ms、100-200ms等,超过500ms的认为是bad three-way handshake。
可以汇总全网的三次握手时间,也可以统计某个服务器它所接受连接的三次握手的时间,间接的反应出服务器的性能。
如果定位客户端的问题,可以汇总客户端与各个服务器之间的三次握手时间,从而分析客户端的网络性能。
如果不关联具体业务,客户端与服务器之间的某一次连接的三次握手时间意义不大,因此,建议汇总这对客户端与服务器之间所有连接的三次握手时间,求得max、min、avg或者汇总区间范围。根据这个汇总,又可以在全网或者某个用户组下展示IP对之间的TCP性能。
基本的思路就是汇总服务器端的性能、客户端的性能、ip对(客户与服务器)之间的性能。然后在全网、接口或者用户组下进行展示。
三次握手平均时间 = sum(三次握手大于0的时间)/sum(三次握手时间大于0的次数) 注:在表TCPflow中
假设A与B之间进行N次TCP连接,那它们之间就有N次三次握手时间,那就可以对这些时间进行汇总,求得max、min、avg,或者划分区间范围进行统计。
在三次握手时间中,输出的指标又统计了客户端到测量点的时某某,服务端到测量点的时某某,参考Client_Delay和Server_Delay指标。
2.2 重传
由于IP网络是不可靠的网络,因此TCP报文存在丢包、延迟、错包等情况,如果由于丢包、延迟或者错包造成报文重发的,都认为是TCP重传报文。重传报文区分定时器超时重传和快速重 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 用层协议或者业务出现问题故障时,为了排查是网络的问题可以进一步的去分析该应用层协议或者业务所在传输层性能。
比如某次http页面加载时间很慢,排除dns问题过后,可以分析该次浏览http页面所测量到的TCP层的性能。浏览http页面可能存在很多http rrpair请求应答,这些rrpair可能分别属于不同的TCP连接。那通过这些rrpair的flowid和五元组信息,去TCP指标中过滤出属于这些rrpair的TCP测量数据。然后按照2中的汇总及展示建议进行展示。
又比如ftp数据下载业务,可以根据ftp data数据的flowid和五元组来过滤出属于本次ftp数据下载业务的TCP数据。
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]
以上为《TCP协议KPI及汇总v1.0》的无排版文字预览,完整内容请下载
TCP协议KPI及汇总v1.0由用户“hcj121”分享发布,转载请注明出处