改变AI服务器:探索界面互连芯片技术的创新突破

这篇具有很好参考价值的文章主要介绍了改变AI服务器:探索界面互连芯片技术的创新突破。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

根据TrendForce的数据,AI服务器的出货量约为130,000台,占全球服务器总出货量的约1%。随着微软、Meta、百度和字节跳动等主要制造商相继推出基于生成式AI的产品和服务,订单量显著增加。预测显示,在ChatGPT等应用的持续需求推动下,从2023年到2027年,AI服务器市场预计将保持每年12.2%的复合年增长率。在这种背景下,AI服务器的发展尤为引人注目。

DGX H100:开拓AI领域的先驱性进展

DGX H100是英伟达(NVIDIA) DGX系统于2022年发布的最新版本,也是英伟达(NVIDIA) DGX SuperPOD的核心。该系统采用8个H100 GPU和6400亿个晶体管,其AI性能是上一代的6倍,尤其是在新的FP8精度方面表现出色。此外,DGX服务器还可提供900GB/s带宽,彰显了AI能力的显著提升。

DGX H100服务器采用IP网卡,既可作为网卡,又可作为PCIe扩展交换机,符合PCIe 5.0标准。此外服务器还包括CX7,以2张卡的形式提供,每张卡含有4个CX7芯片,并提供2个800G OSFP光模块端口。对于GPU互连(H100),NVSwitch芯片起到关键作用。每个GPU向外扩展18个NVLink,实现每个链路双向带宽达到50GB/s,总共达到900GB/s的双向带宽。这些带宽分布在4个内置的NVSwitch芯片上,每个NVSwitch对应4-5个OSFP光模块。每个OSFP光模块使用8个光通道,传输速率为100Gbps/通道,因此总速率达到800Gbps,实现高速数据传输。

改变AI服务器:探索界面互连芯片技术的创新突破,人工智能,服务器,运维

CPU、GPU等组件互连:采用PCIe交换机和重定时芯片进行连接

PCIe交换机技术的演进:克服通道限制

PCIe交换机(也称为PCIe集线器)是一个关键组件,用于通过PCIe通信协议连接PCIe设备。它通过扩展和聚合功能,使多个设备能够连接到1个PCIe端口,可在很大程度上克服PCIe通道数量局限的问题。目前,PCIe交换机广泛应用于传统存储系统,并在各种服务器平台上越来越受欢迎,为系统内的数据传输速率提供显著改善。

随着时间的推移,PCIe总线技术的进展意味着PCIe交换机速率的逐渐增加。最初由英特尔于2001年作为第三代I/O技术以"3GIO"的名义推出,经过PCI-SIG的评估后在2002年更名为"PCI Express"。2003年正式发布的PCIe 1.0成为一个重要的里程碑,支持每通道传输速率为250MB/s,总传输速率为2.5 GT/s。在2022年,PCI-SIG正式发布了PCIe 6.0规范,将总带宽提升至64 GT/s。

改变AI服务器:探索界面互连芯片技术的创新突破,人工智能,服务器,运维

PCIe重定时行业的主导趋势

在AI服务器中,为了确保GPU和CPU连接时的信号质量,至少需要使用一个重定时芯片。一些AI服务器选择使用多个重定时芯片,比如Astera Labs就在其AI加速器配置中集成了4个重定时芯片。

改变AI服务器:探索界面互连芯片技术的创新突破,人工智能,服务器,运维

目前,PCIe重定时市场具有巨大的潜力,有三家领先品牌和许多潜在竞争对手。目前,Parade Technologies、Astera Labs和澜起科技是这个蓬勃发展市场的主要参与者,占据重要的地位。值得注意的是,作为PCIe部署的早期使用者,澜起科技是中国内地唯一能够大规模生产PCIe 4.0重定时的供应商。此外,澜起科技在PCIe 5.0重定时的开发方面也取得了稳步进展。

改变AI服务器:探索界面互连芯片技术的创新突破,人工智能,服务器,运维

此外,Renesas、TI和微芯科技等芯片制造商也积极参与PCIe重定时产品的开发。根据官网站信息,Renesas提供2款PCIe 3.0重定时产品,分别是89HT0816AP和89HT0832P。TI提供了一款16Gbps 8通道PCIe 4.0重定时产品- DS160PT801。此外,微芯科技在2020年11月推出了XpressConnect系列的重定时芯片,旨在实现PCIe 5.0的32GT/s速率。

GPU之间的互连:NVLink和NVSwitch

全球主要芯片制造商非常重视推广高速接口技术。其中,英伟达(NVIDIA)的NVLink、AMD的Infinity Fabric和英特尔的CXL都做出了重要贡献。

NVLink是由英伟达(NVIDIA)开发的高速互连技术。它旨在加速CPU与GPU、GPU与GPU之间的数据传输速率,提升系统性能。从2016年到2022年,NVLink经历多次升级,已经发展到第四代。2016年,英伟达(NVIDIA)配合Pascal GP100 GPU的发布推出第一代NVLink。NVLink采用了高速信号互连(NVHS)技术,主要用于GPU之间和GPU与CPU之间的信号传输。GPU之间通过差分阻抗电信号以NRZ(不归零)形式进行编码传输。第一代NVLink单链路实现了40GB/s的双向带宽,单个芯片可以支持4个链路,总双向带宽达到160GB/s。

改变AI服务器:探索界面互连芯片技术的创新突破,人工智能,服务器,运维

NVLink不同阶段的发展

NVLink技术经历多次迭代,推动了高速互连的创新。2017年,基于Volta架构推出第二代NVLink。它实现每个链路50GB/s的双向带宽,每个芯片支持6个链路,总双向带宽达到300GB/s。2020年,基于Ampere架构的第三代发布,总双向带宽达到600GB/s。在2022年,基于Hopper架构的第四代推出。这一迭代转向使用PAM4调制的电信号,每个链路保持50GB/s的双向带宽,每个芯片支持18个链路,总双向带宽达到900GB/s。

NVSwitch的发展推动实现高性能GPU互连

在2018年,英伟达(NVIDIA)推出NVSwitch的最初版本,为增强带宽、减少延迟和促进服务器内多个GPU之间的通信提供解决方案。第一代NVSwitch采用TSMC的12nm FinFET工艺制造,拥有18个NVLink 2.0接口。通过部署12个NVSwitch,1个服务器可以容纳和优化16个V100 GPU之间的互连速率。

改变AI服务器:探索界面互连芯片技术的创新突破,人工智能,服务器,运维

目前,NVSwitch已经发展到第三代,采用TSMC的4N工艺制造。每个NVSwitch芯片配备了64个NVLink 4.0端口,使GPU之间的通信速率达到了900GB/s。通过NVLink Switch互连的GPU可以集体作为一个具有深度学习能力的高性能加速器运行。

总结

PCIe芯片、重定时芯片和NVSwitch等接口互连芯片技术的发展很大程度上增强CPU和GPU之间以及GPU之间的互动能力。这些技术的相互作用凸显了人工智能服务器的动态景观,为高性能计算的进步做出贡献。文章来源地址https://www.toymoban.com/news/detail-825765.html

到了这里,关于改变AI服务器:探索界面互连芯片技术的创新突破的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 探索KeyarchOS:国内服务器之光

    近年来,我国操作系统技术取得了长足的进步,越来越多的国内操作系统开始崭露头角。KeyarchOS作为浪潮信息自主研发的一款服务器操作系统 , 不仅兼容CentOS生态产品和创新技术产品,还具备性能和稳定性、安全性、可扩展性等特点 。在这里,我们通过案例、技术对比和实

    2024年01月23日
    浏览(44)
  • 服务器如何设置多用户登录?Windows服务器多界面设置方法

    当你在使用服务器时是否有遇到这样一个问题?当你正在服务器里进行工作时,突然一个小伙伴在没有告知你的情况下进入了服务器里,导致你服务器失去连接了,这种情况是非常常见的现象。 主要原因就是因为服务器没有安装多界面,服务器多开界面是占用的同一台服务器

    2024年02月10日
    浏览(61)
  • FTP服务器登录界面卡死

    登录界面卡死怎么办?   1. 进入「本机」,在空白处按一下鼠标右键,点击菜单中的「新增一个网络位置」。    2. 出现新增网络位置,按下一步。  3. 直接按下一步。  4. 输入FTP站点的IP或地址,然后按「下一步」。 如果输入的是FTP地址,前面记得要加「ftp://」。  5. 取消

    2024年02月16日
    浏览(45)
  • 关于如何解决IDEA中修改HTML或CSS,但是服务器上的HTML却不改变的问题

    首先这是记录我个人在IDEA上的做web项目被坑出来的经验,有时候你修改了那么多CSS却没有效果 很可能是IDEA的问题,不是你的问题 事先声明 我用的是tomcat服务器 ,css放在webapp下的css文件夹,html放在webapp下的page文件夹,浏览器选择谷歌 1.方法一:直接关闭tomcat服务器,关闭

    2024年02月04日
    浏览(42)
  • 8路TTL串口转以太网串口服务器芯片EBT3002功能

    EBT3002  以太网芯片是实现8路TTL串口数据与以太网数据互相转换的以太网串口服务器芯片;该以太网芯片具有多种Modbus网关模式以及TCP/DUP/MQTT/HTTP物联网网关模式,可满足各类 串口IO联网设备 与PLC设备的联网功能。 以太网芯片 采用采用LQFP100封装,便于用户集成。 ● 支持10M以

    2024年02月09日
    浏览(50)
  • macOS(m芯片)连接服务器及其进行文件传输的各种方式的详解

    说明:使用了macOS后发现,win系统能使用的xshell、xftp等连接服务器及其文件传输等软件均不能使用了,没有兼容的版本。所以我们刚切换到mac系统该如何去适应呢。 macOS中前文也说道我们使用的是iterm2进行终端控制的,所以连接远程服务器可以通过ssh来连接 缺点:每次都需要

    2024年02月13日
    浏览(46)
  • 统信服务器安装GUI图形化界面

    原文链接:统信服务器安装GUI图形化界面 hello,大家好啊,今天给大家带来一篇在统信UOS服务器操作系统CLI环境上安装GUI,文章前面的内容是安装一个CLI环境的服务器操作系统,然后后半部分的内容是在此基础上安装GUI,大家可以根据需要选择感兴趣的部分阅读查看。 1、选

    2024年01月21日
    浏览(55)
  • Ubuntu 22 服务器端安装图形化界面

    Ubuntu 系统做得是越来越好了,从CentOS 不再提供维护后,越来越多的企业和公司从CentOS转到Ubuntu服务器系统,转了之后才发现,它比CentOS好用太多了,安装什么都非常的方便,而且它不会像CentOS那样在安装的过程中会出现一系列的问题。 今天,我们将重点介绍Ubuntu 22 服务器版

    2024年02月12日
    浏览(49)
  • 探索AWSLambda与MicrosoftAzurePowerApps:集成和自定义服务器less服务

    作者:禅与计算机程序设计艺术 随着云计算技术的不断发展,服务器less计算作为一种新兴的云计算服务,逐渐成为人们关注的热点。在云计算的世界里,AWS Lambda 和 Microsoft Azure Power Apps 是两种非常具有优势的服务,本文旨在探讨如何将它们集成起来,实现服务器less服务的自

    2024年02月07日
    浏览(59)
  • 【兴趣探索】采用Docker部署Rustdesk自建服务器

    场景:本想找一个远程手机的软件,使用的三款都存在限制: ①向日葵一天只能远程三次,需要花钱升级会员 ②Todesk因为手机兼容问题,需要花钱买插件解决 ③Airdorid免费200M,之后也是收费 最终找到了RustDesk免费,不过还是存在弊端“卡顿”,我自身有买了云服务器,就自

    2023年04月24日
    浏览(51)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包