从带宽和 cpu 的发展看未来的传输协议

这篇具有很好参考价值的文章主要介绍了从带宽和 cpu 的发展看未来的传输协议。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

简单展示以太网和 CPU 的发展轨迹:
从带宽和 cpu 的发展看未来的传输协议,性能优化

图中那条粗的约束线扭曲了坐标轴,三个维度不再正交,最终卷于一点,这封闭的体积就是极限。由于 cpu 在执行串行流,加之冯诺依曼内存墙,它将比以太网芯片更快更早逼近极限。

以太网提速比 cpu 更快更有效,虽然一开始二者几乎同步发展,但越往后网络带宽的发展速度相对越快:服务器网卡比 cpu 更快,交换机交换容量比服务器网卡更快,网络处理比端计算更快。(事实上哪是更快,只是单位时间更多)

造成这结局的原因很容易理解,同样是芯片,网络芯片功能更单一,更容易堆砌相同的组件来完成,并行干扰很容易通过调制和编码解决,而 cpu 作为通用芯片,集成密度越高越复杂,复杂性通过堆砌多核可缓解,可多核又面临内存带宽瓶颈。网络芯片可看做道路运输,很容易通过提高车速,增加车道,加大集装箱容积来提高运量,而 cpu 则可看做生产车间,增加工人和机器,同时提高机器运转速度只会让工人,机器间的协作更不易,增加新的车间后多个车间的工人从同一处取配料,则又增加了协作瓶颈,产量自然不能按经理预期提高。

似乎又回到了电话时代,端成了哑端,网络设备将更厉害。瘦网胖端的互联网设计理念还成立吗?
当然成立!这要求未来的网络协议要更简练。全链路瓶颈在计算,而协议处理需要消耗计算资源,想想 tcp sack,又是遍历又是查找,ipv4 的协议头不定长显然也会增加协议处理复杂性。

曾经瘦网胖端说端到端协议比如 tcp 复杂些无所谓,毕竟 cpu 相对更强,ip 简单就行,未来的 cpu 相对网络更慢,端到端协议也不允许胖了,整个网络协议全要瘦身。

未来的端到端协议肯定不能是保序协议,必是乱序协议,多个 cpu 核共同打满 sender 带宽,receiver 的多 cpu 核共同处理收到的数据,胖端指的是 cpu 多显得胖,而不是协议复杂显得胖。也许未来 100+ 众核才能服务好一个 1.6Tbps 端口,保序流的同步约束只能让一个 cpu 核处理单流,想想一个孤单弱小的 cpu 核面对 1.6Tbps 时是多么无力。

未来的端到端协议一定要具备被众 cpu 核一起处理的能力,但每个核的处理都不能过于复杂,端到端协议应该更容易在空间上展开而不是在时间上展开(虽然对于结果,二者是等效的):
从带宽和 cpu 的发展看未来的传输协议,性能优化

tcp 和 quic 都不适合,包括各自的 mp(multi-path) 版本也不行,先把本就可以散列的数据绑在一个 connection,再在 multi-path 分发这 connection 的数据包,这种迂回的操作显然没有跳出传统的 stream-style 认知,协议的本意显然是想将 connection 作为一个整体被控制,就陷入了 stream-style 的泥潭,同流同核就自然而然,然后是各种 load 不 balance 而诞生出的各种 offloading “优化方案”。

乱序传输协议慢慢多了,我之前说过,传输协议把 cpu 发展的路子再走一遍就行,cpu 如今都没解决乱序执行的 trade-off 的根源在于指令本来就是时间序的 stream-style,顺序中强制乱显然就很难,但 data 没有时间序约束,只是因为人们潜意识中一直叫它 data stream,这个 stream-style 是强加的,data 本身显然只有空间序,而空间序是可以打乱后重组的。

用 1~10 条 tcp 流填满 100Gbps 端口和把数据 “喷射” 到对端,哪个更难?忘记比记住更难。

浙江温州皮鞋湿,下雨进水不会胖。文章来源地址https://www.toymoban.com/news/detail-765043.html

到了这里,关于从带宽和 cpu 的发展看未来的传输协议的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 腾讯云服务器SA3实例AMD处理器CPU网络带宽性能详解

    腾讯云AMD服务器SA3实例CPU采用2.55GHz主频的AMD EPYCTM Milan处理器,睿频3.5GHz,搭载最新一代八通道DDR4,内存计算性能稳定,默认网络优化,最高内网收发能力达1900万pps,最高内网带宽可支持100Gbps 。腾讯云服务器网分享腾讯云AMD服务器SA3实例性能详解: 目录 腾讯云CVM服务器S

    2024年02月08日
    浏览(72)
  • 腾讯云轻量应用服务器:2核4G5M性能测评CPU带宽流量限制

    腾讯云2核4G5M轻量应用服务器配置上线了,这款轻量服务器5M公网带宽,每月500G免费流量,系统盘为60GB SSD盘,这款轻量服务器2023年4月报价出炉,一年168元、三年628元,如果选择免费赠送3个月是198元15个月,腾讯云百科来详细说下腾讯云轻量2核4G5M服务器配置、选择、限制条

    2024年02月10日
    浏览(80)
  • 性能测评:腾讯云轻量服务器4核8G12M带宽流量CPU主频型号

    腾讯云轻量4核8G12M应用服务器带宽,12M公网带宽下载速度峰值可达1536KB/秒,折合1.5M/s,每月2000GB月流量,折合每天66GB,系统盘为180GB SSD盘,地域节点可选上海、广州或北京,4核8G服务器网来详细说下腾讯云轻量应用服务器4核8G12M配置、CPU型号处理器主频、限制条件、公网带

    2023年04月18日
    浏览(55)
  • 软路由的负载均衡设置:优化网络性能和带宽利用率

    在现代网络环境中,提升网络性能和最大化带宽利用率至关重要。通过合理配置软路由IP的负载均衡设置,可以有效地实现这一目标,并提高整体稳定性与效果。本文将详细介绍如何进行软路由IP的负载均衡设置,从而优化网络表现、增加带宽利用效率,并为读者呈现一个完善

    2024年02月09日
    浏览(40)
  • 1.1.1.多线程的发展--对cpu性能的压榨史

    1.单进程人工切换。纸带机。只能解决简单的数学问题。 2.单道批处理。多进程批处理。多个任务批量执行。解决手动操作时需要人工切换作业导致的系统利用率低的问题 3.多进程并行处理。把程序写在不同的内存位置来回切换。当一个作业在等待I/O处理时,多批处理系统会

    2024年02月04日
    浏览(22)
  • 性能优化(CPU优化技术)-NEON 介绍

    「发表于知乎专栏《移动端算法优化》」 本节主要介绍基本 SIMD 及其他的指令流与数据流的处理方式,NEON 的基本原理、指令以及与其他平台及硬件的对比。 🎬个人简介:一个全栈工程师的升级之路! 📋个人专栏:高性能(HPC)开发基础教程 🎀CSDN主页 发狂的小花 🌄人

    2024年01月24日
    浏览(50)
  • 性能优化(CPU优化技术)-NEON指令介绍

    「发表于知乎专栏《移动端算法优化》」 本文主要介绍了 NEON 指令相关的知识,首先通过讲解 arm 指令集的分类,NEON寄存器的类型,树立基本概念。然后进一步梳理了 NEON 汇编以及 intrinsics 指令的格式。最后结合指令的分类,使用例子讲述 NEON 指令的使用方法。 🎬个人简介

    2024年01月24日
    浏览(41)
  • 网络协议--TCP的未来和性能

    TCP已经在从1200 b/s的拨号SLIP链路到以太数据链路上运行了许多年。在80年代和90年代初期,以太网是运行TCP/IP最主要的数据链路方式。虽然TCP在比以太网速率高的环境(如T2电话线、FDDI及千兆比网络)中也能够正确运行,但在这些高速率环境下,TCP的某些限制就会暴露出来。

    2024年02月07日
    浏览(27)
  • CPU性能优化——“瑞士军刀“

            最近在做一些工具的预研工作,会涉及到对工具的压力测试,分析工具的资源消耗等问题,其中CPU 资源消耗是关键指标之一。为了后续性能优化做准备,回顾了以前相关CPU优化知识,并做总结分享。希望能帮助到正在遇到相关问题的同事。         cpu 使用率

    2024年02月05日
    浏览(59)
  • CPU和GPU性能优化

    在Unity游戏开发中,优化CPU和GPU的性能是非常重要的,可以提高游戏的运行效率、降低功耗和延迟,并提高用户体验。以下是一些优化CPU和GPU性能的方法: 1.优化游戏逻辑和算法 减少不必要的计算和内存操作,例如避免频繁的分配和释放内存,减少不必要的数据结构和循环。

    2024年02月09日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包