传输层

一、概述

​ 传输层协议为运行在不同Host上的==进程== 提供了一种逻辑通信机制

二、多路复用/分用

1. 接收端进行多路分用:

传输层依据头部信息将收到的 Segment交给正确的Socket, 即不同的进程

2. 发送端进行多路复用:

从多个Socket接收数据,为每 块数据封装上头部信息,生成 Segment,交给网络层

image-20211031120310171

3. 无连接分用:

UDP的Socket用二元组标识 (目的IP地址,目的端口号)
image-20211031112042199

4. 面向连接分用:

TCP的Socket用四元组标识 (源IP地址 , 源端口号 , 目的IP地址 , 目的端口号)
服务器可能同时支持多个TCP Socket ,每个Socket用自己的四元组标识
Web服务器为每个客户端开不同的 Socket

image-20211031112147945

5. 面向连接的分用:多线程Web服务器

image-20211031112314871

三、UDP (User Datagram Protocol)

1. 概述

  • 基于IP协议增加功能:==复用/分用==、简单的错误校验
  • Best effort:可能丢失、非按序到达
  • 无连接

2. 优点

  • 无需建立连接:延迟小、实现简单
  • 头部开销小:8个字节
  • 没有拥塞控制:应用可以更好地控制发送时间和效率
  • UDP 支持一对一、一对多、多对一和多对多的交互通信

3. 应用场景

  • 流媒体:容忍丢失、速率敏感
  • DNS、SNMP

4. 如何在UDP上实现可靠数据传输?

  • 在应用层增加可靠性机制
  • 应用特定的错误恢复机制

5. UDP报文格式

单独UDP报文

image-20211031114903711

连接上IP报伪首部(为了计算校验和)

image-20211031114828269

6. UDP校验和

  • 目的:检测UDP段是否发生了错误

  • 计算方法(发送方):将段的内容视为16-bit整数,计算所有整数的和 ,进位加在和的后面,将得到的值按位求反,得到校验和,将其放入校验和字段

  • 检测方法(接收方):计算所收到段的校验和,将其与校验和字段进行对比:

    • 不相等:检测出错误
    • 相等:没有检测出错误(但可能有错误,如两个位翻转了)
  • 举例
    image-20211031120239918

    image-20211031115805184

四、可靠数据传输

1. 什么是可靠?依靠什么实现

  • ==不错、不丢、不乱==
  • 合理的可靠数据传输协议(Rdt)

2. 不可靠信道传输实现

image-20211031141228486
image-20211031142530489

3. Rdt1.0

可靠信道上的可靠数据传输

  • 底层信道完全可靠
  • 发送方和接收方的FSM(有限状态机)独立

image-20211031144023533

4. Rdt2.0

只产生位错误的信道

  1. 如何==差错检测==:校验和
  2. 如何从错误中恢复
    • ==确认机制==:接收方显示的告知发送方分组已正确(ACK)或错误(NAK)接收
    • 发送方收到NAK后==重传==
    • 基于这种重传机制的rdt协议称为ARQ协议
  3. FSM实现(了解):
    image-20211031150356713

5. Rdt2.1和2.2

  1. Rdt2.0的问题:ACK/NAK消息 错误/被破坏

  2. 解决方法:

    • 若ACK/NAK被破坏,则发送方重传
    • 发送方给每个分组添加序列号,接收方丢弃重复分组
  3. FSM实现
    image-20211031154535666
    image-20211031154624207

  4. Rdt2.2的改进:无NAK消息的协议

    将最后确认的分组序号加入ACK信息中

6. Rdt3.0

信道既可能发生错误,也可能丢失分组

  1. Rdt2.2基础上改进方法:等待 =="合理"== 时间后没收到ACK,则重传(加上序列号)

  2. 需要定时器

  3. FSM
    image-20211031155701357

  4. 示例:
    image-20211031161505339

    image-20211031161526459

  5. Rdt3.0性能极差!信道利用率低!

7. 流水线机制

用于改善Rdt3.0的性能问题

image-20211031161911168

改进要求

  • 更大的序列号范围
  • 发送方和接收方需要更大的存储空间以缓存分组

**改进实现:**滑动窗口协议

8. 滑动窗口协议

  1. 窗口
    • 允许使用的序列号范围
    • 窗口尺寸为N:最多有N个等待确认的消息
  2. 滑动窗口
    • 随着协议的运行,窗口在序列号空间内向前移动
  3. 示例图
    image-20211031163805118

9. 滑动窗口协议——GBN

  • 采用累积确认机制:确认到序列号n(包含n)的分组均已被正确接收
  • 为空中的分组设置计时器(timer)应对分组丢失
  • 超时Timeout(n)事件: 重传序列号大于等于 n,还未收到ACK的所有分组,称为GoBack-N
    • 举例:n如果发送方发送了前 5 个分组,而中间的第 3 个分组丢失了。这时接收方只能对前两个分组发出确认。发送方无法知道后面三个分组的下落,而只好把后面的三个分组都再重传一次。
  • 示例图image-20211031165654831

10. 滑动窗口协议——SR

Selective Repeat 协议

  • 采用单独确认

  • 设置缓存机制,缓存乱序到达的分组

  • 发送方只重传没收到ACK的分组(为每个分组设置定时器)

  • 为接收方设置一个不同步的窗口
    image-20211031170508540

  • 运行流程

    image-20211031170921414

  • 窗口与序列号关系:
    Ns+Nr <= 2k
    序列号过小时会出错

五、TCP的工作机制

1. TCP概述

  • 点对点:一个发送方、一个接收方
  • 可靠、按序的字节流
  • 流水线机制(GBN和SR混合协议)
  • 发送方/接收方缓存
  • 全双工面向连接协议
    • 通信双方在发送数据之前必须建 立连接。
    • 连接状态只在连接的两端中维护 ,在沿途节点中并不维护状态。
    • TCP连接包括:两台主机上的缓 存、连接状态变量、socket 等
  • 流量控制机制、拥塞控制机制

2. TCP段结构

TCP 报文段首部的前 20 个字节是固定的,后面有 4n 字节是根据需要而增加的选项 (n 是整数),因此 TCP 首部的最小长度是 20 字节。

image-20211031172807490

  • 序号字段——占 4 字节。TCP 连接中传送的数据流中的每一个字节都编上一个序号。序号字段的值则指的是本报文段所发送的数据的第一个字节的序号。
    例如1k数据拆成2个,则序号分别为0 和 500。
  • 确认号字段——占 4 字节,是期望收到对方的下一个报文段的数据的第一个字节的序号。
  • 数据偏移(即首部长度)——占 4 位,它指出 TCP 报文段的数据起始处距离 TCP 报文段的起始处有多远。“数据偏移”的单位是 32 位字(以 4 字节为计算单位)
  • 保留字段——占 6 位,保留为今后使用,但目前应置为 0。
  • 紧急 URG —— 当 URG = 1 时,表明紧急指针字段有效。它告诉系统此报文段中有紧急数据,应尽快传送(相当于高优先级的数据)。
  • 确认 ACK —— 只有当 ACK = 1 时确认号字段才有效。当 ACK = 0 时,确认号无效。
  • 推送 PSH (PuSH) —— 接收 TCP 收到 PSH = 1 的报文段,就尽快地交付接收应用进程,而不再等到整个缓存都填满了后再向上交付。
  • 复位 RST (ReSeT) —— 当 RST = 1 时,表明 TCP 连接中出现严重差错(如由于主机崩溃或其他原因),必须释放连接,然后再重新建立运输连接。
  • 同步 SYN —— 同步 SYN = 1 表示这是一个连接请求或连接接受报文。
  • 终止 FIN (FINish) —— 用来释放一个连接。FIN = 1 表明此报文段的发送端的数据已发送完毕,并要求释放运输连接。
  • 窗口字段 —— 占 2 字节,用来让对方设置发送窗口的依据,单位为字节。
  • 检验和 —— 占 2 字节。检验和字段检验的范围包括首部和数据这两部分。在计算检验和时,要在 TCP 报文段的前面加上 12 字节的伪首部。
  • 紧急指针字段 —— 占 16 位,指出在本报文段中紧急数据共有多少个字节(紧急数据放在本报文段数据的最前面)。
  • 选项字段 —— 长度可变。TCP 最初只规定了一种选项,即最大报文段长度 MSS。MSS 告诉对方 TCP:“我的缓存所能接收的报文段的数据字段的最大长度是 MSS 个字节。”

3. TCP可靠传输的实现

  1. 以字节为单位的滑动窗口

    • 发送缓存暂时存放
      • 发送应用程序传送给发送方TCP准备发送的数据
      • TCP已发送出但尚未收到确认的数据
    • 接收缓存用来暂时存放
      • 按序到达的、但尚未被接受应用程序读取的数据
      • 不按序到达的数据
  2. 超时重传时间的选择(重要

    • TCP对每个发送的报文段设置一个定时器,超时还未收到确认就重传

    • 参考Rdt3.0第四小节的示例图可知,若重传时间过短,会引起不必要重传;若时间太长,则使网络空闲时间过长,且对段丢失不敏感,降低了传输效率

    • TCP采用了自适应算法,记录报文段从发出到收到确认的时间差,作为报文段的往返时间RTT(RoundTrip Time)

    • 加权平均往返时间RTT~s~

      计算方法:

      • 初始RTT~s~ = RTT
      • 新RTT~s~ = (1-α)*RTT~s~ + α*RTT~新~
      • RFC 2998:推荐 α = 0.125
    • 超时重传时间RTO(Retransmission Time-Out)

      计算方法:

      • 初始RTT~D~ = RTT/2

      • 新RTT~D~ = (1-β) * RTT~D~ + β * | RTT~s~ - RTT |

      • RTO = RTT~s~ + 4 * RTT~D~

      • 建议 β = 0.25

    • Karn算法:

      • 概述:计算RTT时,只要报文段重传了,就不采用其往返时间样本
      • 问题:超时重传时间无法更新
      • 修正:报文段每次重传,增大RTO(翻倍)
  3. 选择确认SACK

    • 即SR协议

4. TCP的流量控制

Q:为什么要进行流量控制?

A:如果发送方把数据发送得过快,接收方就可能来不及接收,这就会造成数据的丢失。

通过可变窗口实现流量控制

  • 接收方向发送方告知接收窗口(rwnd)大小
    image-20211031195322349

可能发送死锁

  • 如上例,一段时间后B可以接收信息了,于是向A发送rwnd=400消息,但这条消息丢失了,于是一直死锁

通过持续计时器解决死锁问题

  • 当A收到零窗口时开始计时
  • 时间到,A发送一个零出口探测报文段,B回发确认时给出当前窗口值
  • 若还为0,则重新计时,不为0则打破死锁

控制TCP报文段发送的三种机制

  • 当缓存中存放的数据等于MSS时组装发送
  • 首部的PUSH字段控制
  • 发送方的一个计时器期限到时组装发送

糊涂窗口综合征

指当发送端应用进程产生数据很慢、或接收端应用进程处理接收缓冲区数据很慢,或二者兼而有之;就会使应用进程间传送的报文段很小,特别是有效载荷很小,极端情况下只传输1个字节,花费41个字节开销,效率降低

使用Nagle算法解决发送方糊涂窗口综合征

  • 发送方先将第一个数据字节发出,把后面到达的数据字节缓存起来,当发送方收到对第一个字节的确认后,再组装发送缓存中的所有数据
  • 当到达的数据已达到发送窗口大小的一半或报文段的最大长度时,立即发送报文段

解决接收方糊涂窗口综合症

  • 让接收方等待一段时间,直到接收缓存能容纳一个最长的报文段或等到接收缓存的一半空闲时间

5. 拥塞控制概述

拥塞:在某段时间内,对网络中某资源的需求超过了该资源所能提供的可用部分,网络的性能就会变差

Q增加资源能解决拥塞吗

A不能。这是因为网络拥塞是一个非常复杂的问题。简单地采用上述做法,在许多情况下,不但不能解决拥塞问题,而且还可能使网络的性能更坏

引起网络拥塞的因素

  • 增大缓存,但未提高输出链路的容量和处理机的速度,排队等待时间将会大大增加**,**引起大量超时重传,解决不了网络拥塞
  • 提高处理机处理的速率会会将瓶颈转移到其他地方
  • 拥塞引起的重传并不会缓解网络的拥塞,反而会加剧网络的拥塞。

拥塞控制和流量控制的区别

  • 拥塞控制时防止过多的数据注入到网络中,使网络中的路由或链路不过载,拥塞控制的前提时网络能承受现有的网络负荷,拥塞控制是一个全局性的过程,涉及所有的主机、路由、以及降低网络传输性性能有关的所有因素
  • 流量控制是端对端的控制,是发送端与接收端之间的控制

解决方案

  • 开环控制:在设计网络时事先将有关发生拥塞的因素考虑周到,力求网络在工作时不产生拥塞
  • 闭环控制:基于反馈环路的概念
    • 监测网络系统以便检测到拥塞在何时、何处发生。
    • 将拥塞发生的信息传送到可采取行动的地方。
    • 调整网络系统的运行以解决出现的问题

网络拥塞检测指标

  • 由于缺少缓存空间而被丢弃的分组的百分数;
  • 平均队列长度
  • 超时重传的分组数
  • 平均分组时延
  • 分组时延的标准差,等等

6. TCP的拥塞控制

TCP采用基于窗口的方法进行拥塞控制,属于闭环控制方法

  • TCP发送方维持一个拥塞窗口CWND(Congestion Window)
  • 拥塞窗口的大小取决于网络的拥塞程度,并且动态地在变化
  • 发送端利用拥塞窗口根据网络的拥塞情况调整发送的数据量
  • 真正的发送窗口值 = Min(公告窗口值,拥塞窗口值)

拥塞窗口的原则

  • 只要网络没有出现拥塞,拥塞窗口就可以再增大一些,以便把更多的分组发送出去,这样就可以提高网络的利用率
  • 但只要网络出现拥塞或有可能出现拥塞,就必须把拥塞窗口减小一些,以减少注入到网络中的分组数,以便缓解网络出现的拥塞

拥塞的判断

  • 重传定时器超时
  • 收到三个相同(重复)的ACK

TCP拥塞控制算法

  • 慢开始
  • 拥塞避免
  • 快重传
  • 快恢复
  • AIMD:加法增大,乘法减小(对cwnd)

慢开始

  • 从小到大逐渐增加拥塞窗口数值
  • 初始拥塞窗口cwnd设置:不超过2~4个最大报文段SMSS的值
  • 慢开始门限ssthresh(状态变量):防止拥塞窗口增长过大引起网络拥塞
  • 拥塞窗口 cwnd 控制方法:在每收到一个对新的报文段的确认后,可以把拥塞窗口增加最多一个 SMSS 的数值
  • 拥塞窗口cwnd每次的增加量 = min (N, SMSS) 其中 N 为原先未被确认的、但现在被刚收到的确认报文段所确认的字节数
  • 用这样的方法逐步增大发送方的拥塞窗口 cwnd,可以使分组注入到网络的速率更加合理
  • image-20211119165425483

拥塞避免算法

  • 触发条件:cwnd > ssthresh
  • 思路:让拥塞窗口 cwnd 缓慢地增大,即每经过一个往返时间 RTT 就把发送方的拥塞窗口 cwnd 加 1,而不是加倍,使拥塞窗口 cwnd 按线性规律缓慢增长
  • 慢开始是收到一个ACK确认时,cwnd+1,指数级增长;
    拥塞避免是经过一个RTT后cwnd+1,线性增长

当网络出现拥塞(超时重传)时

  • ssthresh = max(cwnd/2,2)
  • cwnd = 1
  • 执行慢开始

目的:迅速减少主机发送到网络中的分组数,使得发生拥塞的路由器有足够时间把队列中积压的分组处理完毕

拥塞控制案例1

image-20211119170723503

这里 ④ 判断拥塞是收到三个重复的ACK,所以 ⑤ 应该执行快重传和快恢复

快重传算法

  • 可以让发送方尽早知道发生了个别报文段的丢失
  • 快重传要求接收方不要等待自己发送数据时才进行捎带确认,而是要立即发送确认,即使收到了失序的报文段也要立即发出对已收到的报文段的重复确认
  • 发送方只要一连收到三个重复确认,就知道接收方确实没有收到报文段,网络拥塞,立即进行重传
  • 举例:
    image-20211119171912089

快恢复算法

​ 当发送端收到连续三个重复的确认时,由于发送方现在认为网络很可能没有发生拥塞,因此现在不执行慢开始算法,而是执行快恢复算法 FR (Fast Recovery) 算法

  • ssthresh = cwnd / 2
  • cwnd = ssthresh
  • 开始执行慢拥塞避免算法

发送窗口的上限值

  • 发送窗口的上限值 Min [rwnd, cwnd]
  • rwnd 和 cwnd 中数值较小的一个,控制了发送方发送数据的速率

7. 主动队列管理AQM

背景

  • TCP 拥塞控制和网络层采取的策略有密切联系,其中影响最大的就是路由器的分组丢弃策略
  • 当路由器队列满时,以后再到达的分组会被丢弃,发送方出现超时重传,使TCP进入慢开始状态
  • 更为严重的是,在网络中通常有很多的 TCP 连接,这些连接中的报文段通常是复用在网络层的 IP 数据报中传送的,在这种情况下,若发生了路由器中的尾部丢弃,就可能会同时影响到很多条 TCP 连接,结果使这许多 TCP 连接在同一时间突然都进入到慢开始状态。这在 TCP 的术语中称为全局同步 (global syncronization)

AQM

  • 思路:在队列长度达到某个值得警惕的数值时(即当网络拥塞有了某些拥塞征兆时),就主动丢弃到达的分组
  • 实现:随机早期检测 RED (Random Early Detection)

RED

image-20211119173339917

在 RED 的操作中,最难处理的就是丢弃概率 p 的选择

六、TCP的运输连接管理

1. TCP的连接建立

1.1 连接过程存在的三个问题

  • 要使每一方能够确知对方的存在
  • 要允许双方协商一些参数(最大窗口值、是否使用窗口扩大选项等等)
  • 能够对运输实体资源(缓存大小、连接表中项目)进行分配

1.2 三次报文握手

  • TCP连接的建立采用客户服务器(C/S)方式
  • TCP建立连接的过程叫做握手
  • 握手需要再客户和服务器之间交换三个TCP报文,称为三报文握手
  • 使用三报文握手主要是防止已失效的连接请求文段突然有传送到了,因而产生错误

1.3 连接建立过程

image-20211119213728912

  • A向B发送连接请求报文段,其首部的同步位SYN=1,并选择序号sq=x,表明传送数据时第一个数据字节的序号是x
  • B收到连接请求报文段后,如同意,则发回确认,确认文段SYN=1,ACK=1,ack=x+1,自己传送的数据序号seq=y(全双工)
  • A收到此报文段后向B给出最终确认,ACK=1,ack=y+1,seq = x+1,同时通知上层应用进程,连接已经建立
  • B收到A的确认之后,通知上层的应用进程:TCP连接已经建立

2. TCP的连接释放

四报文握手(挥手)
image-20211119214721288

  • 数据传输结束后,通信双方都可以释放连接
  • 现在A的应用进程先向其TCP发出连接释放报文段,并停止再发送数据,主动关闭TCP连接
  • 报文段首部FIN=1,其seq=u,等待B的确认
  • B收到后发出确认,ack=u+1,seq=v,TCP服务器进程通知高层应用进程
  • 从A到B方向的连接已经释放了,TCP连接处于半关闭状态,B发送数据A仍要接收
  • 若B已经没有要向A发送的数据,其应用程序就通知TCP释放连接,发送连接释放报文段给A,FIN=1,ACK=1,ack=u+1,seq=w
  • A收到后连接释放报文段后,必须发出确认,ACK=1,ack=w+1,seq=u+1
  • TCP连接必须经过时间2MSL后才真正的释放掉!
    • 保证A发送的最后一个ACK报文段能到达B
    • 防止 “已失效的连接请求报文段”出现在本连接中。A 在发送完最后一个 ACK 报文段后,再经过时间 2MSL,就可以使本连接持续的时间内所产生的所有报文段,都从网络中消失。这样就可以使下一个新的连接中不会出现这种旧的连接请求报文段
    • MSL:报文最大生存时间

3. TCP的有限状态机

image-20211119220235410

Q.E.D.


记录 • 分享 • 日常