TCP 协议的低效实现-Toy模板网

这篇具有很好参考价值的文章主要介绍了TCP 协议的低效实现。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

包括 Linux kernel 在内的各种 TCP 实现均使用类似 skb 的对象管理一个个 packet，使 TCP 失去了 “流” 特征。应用通过 syscall 每写入一批数据，协议栈都可能生成一个 skb：
TCP 协议的低效实现

仅管理这些 skb 就是一笔大开销。除了 skb 数据结构本身的 crud 操作外，在处理 SACK 时还要涉及 split/merge，非常麻烦。为了提高效率，rtx 从链表组织成了红黑树，同时，为了记录 RACK，还有一个时间序链表，这些链表本身都没有错，问题在于在这个框架中，skb 为主，skb->data 被挟裹在 skb 之中，只是其一个属性，本末倒置。

举一个例子，如果 SACK 携带了 12345～22345 这个 block，如何找到它？显然需要操作 skb 队列，看一下 tcp_sacktag_write_queue 这个函数就知道多复杂了。带宽越大，rtx queue 越大，问题越大越复杂。

这件事的局面如下图所示：
TCP 协议的低效实现

其实把 skb 和 data 的关系颠倒一下，将 skb 置于更下层，只负责发送之用。以 data 为主，置于一段平坦的内存空间(一般表示为 ringbuffer)，用 “页表项” 管理每一个固定的小段(比如 4KB)，每段都可以指向一个或几个 skb，而每一个 skb 则反过来指示自己的 data 范围，这就非常简单了。

仍然以 SACK block：12345～22345 为例，连续寻址直接定位到 12345 - una～22345 - una，删除这段区间小段所指向的 skb，对应 skb 收缩或被回收。

这件事的局面如下图所示：
TCP 协议的低效实现