论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks-Toy模板网

这篇具有很好参考价值的文章主要介绍了论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1 原论文的题目（中英文）、题目中包含了哪些关键词？这些关键词的相关知识分别是什么？

题目：PowerTCP: Pushing the Performance Limits of Datacenter Networks

PowerTCP：逼近数据中心的网络性能极限

2 论文的背景：作者、工作单位、发表刊物、索引情况

作者：Vamsi Addanki 、Oliver Michel 、Stefan Schmid

单位：TU Berlin 、University of Vienna、Princeton University

发表刊物：19th USENIX Symposium on Networked Systems Design and Implementation（NSDI2022 计算机网络CCF A类）

3 问题的提出：论文论述的技术/科学是什么问题？为什么会存在这样问题？这种技术/科学问题存在的背景是什么？

本文研究的是数据中心网络的拥塞控制算法。

背景知识：

数据中心中存在三种形式的流：查询流、短流、长流。其中查询流和短流对延迟敏感，长流需要较高的吞吐量。

数据中心对网络的要求：低延迟、高带宽。

常规的TCP协议的拥塞控制机制（慢开始、拥塞避免、快重传、快恢复）不再适用于数据中心网络环境。

4 问题的相关研究：其他相关研究是如何解决类似的问题的？

现有的对数据中心网络拥塞控制的研究主要分为两类：基于网络状态的拥塞控制算法和基于网络变化的拥塞控制算法。

4.1 基于网络状态的拥塞控制算法

根据交换机中 Queue Length 或者RTT来发现拥塞，并且依据这些信息决定该如何调整拥塞窗口的大小（cwnd）。（voltage based）

以DCTCP（Data Center TCP）为例。在交换机处设置阈值 K，数据包达到交换机时，若队列占用值大于K，则标记该数据包。接受端收到带有标记的数据包后返回的ack报文同样带有标记，发送根据收到的ack中带标记的数据包占总发送数据包的比例来调节拥塞窗口大小(cwnd)。

实例：DCTP、DCQCN、HPCC

优点：控制更加准确

缺点：反应较慢（针对突发的网络冲突应对不足）

4.2 基于网络变化的拥塞控制算法

根据交换机中网络变化，比如检测RTT的变化（RTT的梯度），并且依据这些信息决定该如何调整拥塞窗口的大小（cwnd）。（current based）

实例：TIMELY

优点：反应更快

缺点：控制不太精准

4.3 两种拥塞控制算法的问题

论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议

由于当前的网络拥塞控制算法（Congestion Control，简称CC）实现原理的限制，当前CC在反应速度和控制精度上往往只能选一个。

论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议

(a) 当队列长度增长速度发生变化时，基于网络状态的拥塞控制算法的反应是一样的。

(b) 针对于队列长度不同的设备，基于网络变化的拥塞控制算法的反应是一样的。

论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议

5 基本思想：本文解决该问题的基本思想、过程是什么？

实现网络拥塞控制需要如下两个关键点：

如何发现拥塞
如何控制拥塞

5.1 如何发现拥塞

本文使用的是带内网络遥测（In- band network telemetry ，简称INT）。

带内网络遥测原理：

论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议

In-band：监测网络设备的状态时无需单独构造一个数据包，可以将检测信息附加到正常数据包（如TCP、UDP）的包头。（个人理解）

简单的来说，INT可分为两部分：INT Header和INT Metadata

INT Header：由INT的发送端添加进正常数据包，指明了要收集那些信息以及INT最终的接受端是谁。
INT Metadata：记录网络状态，由数据包传输过程中每个网络设备添加（交换机或路由），将需要检测的数据添加进来。

本文的所使用的网络监测方法简介

要监测的信息：

Queue Length (qlen)
Timestamp (ts)
So far transmitted bytes (txBytes)
Bandwidth (b)

监测流程：

论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议表示正常数据包

论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议表示INT Header

论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议表示确认收到的ACK

Sender : 论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议 -->网络设备--->--->Receiver

Sender ：论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议 <-----网络设备<----<-----Receiver

5.2 如何控制拥塞

几乎所有的拥塞控制都是通过控制发送端的拥塞窗口的大小（cwnd）。

具体拥塞窗口该选多大是根据拥塞控制算法算出的。

本文就提出了PowerTCP算法，是一种同时基于网络状态和网络变化的拥塞控制算法。

6 配图：找出全文中最具概括性的一幅配图（架构图/流程图/思路图...），简单解释这张图。这幅图是如何概括全文的？

网络拥塞程度

$论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议$

：反应当前网络的拥塞程度

: 当前队列长度

: 带宽×基本往返时间(不包括排队延迟),飞行中的数据量。

:队列长度变化率

计算拥塞窗口的公式

$论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议$

:拥塞窗口大小

:经验参数，建议取0.9

$论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议$ :基本往返时间（Base RTT） +排队延迟

:增量，经验参数

计算拥塞窗口的算法

论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议

7 实验：采用了什么硬件配置和软件环境？每项测试是在和哪些同类研究做对比？分别测试了哪些指标（例如，延迟/吞吐量/资源利用率...）？

环境：

搭建了一个基于Fat Tree拓扑的数据中心网络，其中有2个核心交换机和256台服务器，它们被组织成4个pod。每个pod由两个ToR交换机和两个汇聚交换机组成。所有交换机到交换机链路的容量均为100Gbps，服务器到交换机链路的容量均为25Gbps。

测量指标：吞吐量、队列长度、尾延迟、短流的99th-percentile flow completion times （FCT），不同大小的流的 99th-percentile FCT。

论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks,论文分享,网络,网络协议

8 二次利用：论文是否提供源代码？

无；

其他开源项目：DCTCP、HPCC、TIMELY文章来源地址https://www.toymoban.com/news/detail-618615.html

到了这里，关于论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

论文分享：PowerTCP: Pushing the Performance Limits of Datacenter Networks

1 原论文的题目（中英文）、题目中包含了哪些关键词？这些关键词的相关知识分别是什么？

2 论文的背景：作者、工作单位、发表刊物、索引情况

3 问题的提出：论文论述的技术/科学是什么问题？为什么会存在这样问题？这种技术/科学问题存在的背景是什么？

4 问题的相关研究：其他相关研究是如何解决类似的问题的？

5 基本思想：本文解决该问题的基本思想、过程是什么？

6 配图：找出全文中最具概括性的一幅配图（架构图/流程图/思路图...），简单解释这张图。这幅图是如何概括全文的？

7 实验：采用了什么硬件配置和软件环境？每项测试是在和哪些同类研究做对比？分别测试了哪些指标（例如，延迟/吞吐量/资源利用率...）？

8 二次利用：论文是否提供源代码？

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2