谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?

这篇具有很好参考价值的文章主要介绍了谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

导语

1.“数据、算法、算力”是数字经济时代的三大核心要素,其中算力是数字经济的物理承载。

2.目前,算力已经成为全球战略竞争的新焦点和国家经济发展的重要引擎。世界各国的算力水平与经济发展水平呈正相关。

3.下面通过四个模块,从微观到宏观,详细分析与性能和算力相关的因素以及算力平台。尽可能直面当前算力提升所面临的挑战和困难,展望未来算力的发展趋势。

1  算力综述

随着数字经济时代的到来,各种各样的应用都需要强大的算力支持。无论从单个设备角度,还是万千设备组成的宏观算力角度,都需要持续的算力来支撑数字经济的繁荣发展。

谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?

根据冯·诺依曼架构,可以绘制出一个典型服务器模型。一个服务器,由核心的处理逻辑、分层级的寄存器、缓存、内存、本地外存四级的暂存存储(云服务器本地存储也是暂存,关键的数据必须存储到远程存储集群)、以及通过网络的输入/输出三部分组成。

站在处理器中处理逻辑部分角度,不管是从各级暂存还是从网络 I/O,都是数据的输入/输出。因此,计算模型可以简单的分为两部分:数据处理和数据输入输出。并且,系统性能 = 最小值(数据处理能力,数据输入/输出能力)。

随着更大规模计算需求的发展,逐渐形成复杂的存储分层结构。计算和 I/O 之间的不匹配导致复杂的存储分层结构,而复杂的存储分层结构一方面增加功耗,另一方面限制性能进一步提升。

谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?

影响性能的三个主要因素

这里说的性能,指的是单位处理器的性能。衡量一个处理器的性能,通常有三个因素:

一、“指令”复杂度,类似于单位时间加工的零件数量,指的是单个指令中计算的密度。

指令是软件和硬件的媒介,指令的复杂度(单位计算密度)决定系统的软硬件解耦程度。按照指令的复杂度,典型的处理器平台大致分为CPU、协处理器、GPU、FPGA、DSA、ASIC。任务在CPU运行,则定义为软件运行;任务在协处理器、GPU、FPGA、DSA或ASIC运行,则定义为硬件加速运行。

鱼和熊掌不可兼得,指令复杂度和编程灵活性是两个互反的特征:指令越简单,编程灵活性越高,因此才说软件有更高的灵活性;指令越复杂,性能越高,因此而受到的限制越多,只能用于特定场景的应用,其软件灵活性越差。

谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?

二、运行速度,即运行频率,类似于一个小时的单位时间数量,指的是1秒钟时钟周期变化的数量。

频率越高,计算速度越快。不考虑其他因素制约,计算速度和频率是正比关系。而频率受电路中的关键路径(延迟最大路径)约束,两者呈反比关系:关键路径越短,频率则越高。频率受关键路径制约,而关键路径与两个因素有关:

  • 关键路径所包含门的数量,即从前一级寄存器到后一级寄存器之间的最长路径所包含的逻辑门数量

  • 单个逻辑门延迟时间,逻辑门延迟时间跟半导体生产工艺相关,一般情况下,工艺尺寸越小,单个逻辑门延迟越小

因此,想要优化频率,就要优化关键路径:一个是优化关键路径的逻辑门数量,另一个则是优化单个逻辑门延迟。当逻辑门延迟越小,或两级寄存器之间的逻辑门数量越少,则频率越高,计算速度也越快。

谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?

三、并行度,类似于团队的成员数量,指的是多个并行的处理。

并行设计在硬件逻辑设计里非常常见。如:

  • 指令流水线:指令流水线是一种时间并行,在同时有多条指令处理流水线的不同阶段,相当于有多条指令在并行处理

  • 指令多发射(Multiple Issue):一条流水线,从指令缓冲区一次发送到译码阶段就有多条指令,然后在执行阶段也是多条指令并行

  • 超线程(Hyper-Thread):在一个处理器核内部,多组不同的指令流处理,分时共享处理器核内部的各种硬件资源,达到更佳的资源利用率,提升整体性能

  • 多总线:如,指令、数据总线分开,多数据总线等设计,进一步增加处理器的数据处理带宽

  • 多核技术:通过一些内部互联总线,把多个处理器核集成到一块芯片内,以此来提升综合性能

  • 多处理器芯片:受限于芯片工艺、功耗水平、设计架构,单芯片内的多核互联不能无限制增加下去,也可以通过一些芯片间互联技术,把多个 CPU Socket 连成一个NUMA系统,当前比较常见的是2-8个 Socket 互联架构

  • 总线:对并行总线来说,增加数据线的宽度,对增加总线的带宽是显而易见的,并行总线一般用于芯片内部逻辑通信;串行总线,例如 PCIe,相比 PCI 并行总线,一方面可以快速提升频率,还可以通过很多组串行线组合通信来提升传输性能,串行总线一般用于芯片间数据通信。

  • 异构计算单元:CPU 和 GPU、xPU 以及各种硬件加速器组成异构多处理单元共同协作完成工作任务,CPU 更多的是承担控制和数据交互的角色。

  • 多服务器集群:现在大型的互联网系统需要成百上千的服务器,分为业务处理、网络处理、存储和数据库处理等不同功能分工的服务器,共同组成一个性能强大并且运行稳定的系统对外提供服务。

通过不同方向、不同层次的并行技术,都可以提升硬件系统的性能。把不同复杂度的单位处理都当作“指令”。那么,我们就可以通过 IPC(Instruction per Cycle)来评价并行度。对一个 CPU 核来说,IPC 代表每个周期执行的指令数;对一个硬件加速模块来说,IPC 则代表一个周期所能进行的单位处理的数量。

简洁明了的用公式表示性能和三者的关系:

(单个处理器)性能 = 指令的复杂度(单位计算密度) x 频率 x 并行度

谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?

宏观的算力

性能是微观的概念,代表单个个体计算能力。而算力则是宏观的概念,算力是很多个体计算能力总和。为了避免混淆,我们采用总算力的叫法。

在前面已经介绍单个个体的性能(在泛I/O不拖后腿的情况下):

(单个处理器)性能 = 指令的复杂度(单位计算密度) x 频率 x 并行度

那么总算力则和单个处理器性能以及处理器的数量成正比:

总算力 = (单个处理器)性能 x 处理器的数量

虽然总算力可以很高,但如果因为各方面原因,其利用率不高,则也不够好。因此:

实际总算力 = 总算力 x 利用率

= 指令的复杂度(单位计算密度) x 频率 x 并行度 x 处理器的数量 x 利用率

相关的若干因素总结一下,要提高宏观的实际总算力,就必须要:

1.提高指令的复杂度(单位计算密度)。新的 DSA 架构创新,均衡考虑不同的算力平台,以及通过异构和超异构计算,融合多种平台一起协作,完成系统级计算。

2.提高运行频率。优化设计,选择最优的流水线级数以及工艺等的持续进步,优化系统的运行频率。

3.提高并行度。更高的扩展性(Scalibility),更高性能的各层级互联总线,并行更多处理引擎。

4.优化 I/O 和处理的匹配度。通过工艺和封装优化,实现更加匹配计算和 I/O 匹配。

5.实现处理器芯片更大规模落地。均衡芯片整体性能和灵活可编程能力,实现宏观总算力最大化。

6.进一步优化宏观算力利用率。算力上规模后,通过云计算、边缘计算、超云、云网融合等手段,持续优化算力利用率,降低算力成本。

简单来说说,算力提升核心就两个方面:

1.增大规模(Scale out),通过扩大算力基础设施建设,以及“东数西算”等方式,构建更大规模并且低能耗的现代化数据中心。

2.提升单个计算节点性能(Scale up),构建新一代创新计算范式,要把算力再持续提升1-2个数量级,并且能够提供非常好的易用编程能力,来持续应对未来10年更加复杂系统的算力需求爆炸挑战。

蓝海大脑作为领先的数字基建提供商,将积极发挥产品和技术优势,提供先进算力支持。

谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?

2  三大主流计算平台CPU、GPU和DSA

CPU

在手机端已经非常成熟的SOC实现,为什么在数据中心端没有大规模应用?为什么直到现在,数据中心依然是以CPU为主的计算平台?这主要源于越是复杂的场景,对软件灵活性的要求越高,而只有CPU能够提供云场景所需的灵活性。

超大规模复杂计算场景对硬件灵活性的要求,主要体现在四个方面:

  • 灵活性。硬件处理引擎要能够很好地支持软件快速迭代。CPU 其灵活基础指令编程的特点,可以认为是最适合云计算的处理引擎。

  • 通用性。厂家购买服务器,很难预测服务器会运行哪类任务。最好的办法是采用完全通用服务器。CPU 其通用性,成为云计算场景最优选择。

  • 利用率。云计算通过虚拟化把资源切分,实现资源共享,以此提高资源利用并降低成本。而目前,只有 CPU 能够实现非常友好的硬件级别的虚拟化支持。

  • 一致性。云计算场景,软硬件相互脱离。同一软件实体会在不同的硬件实体迁移,同一硬件实体也需要运行不同的软件实体。而 CPU,是一致性最好的硬件平台。

  • 谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?

GPU与NP

网络处理器(Network Processor,简称NP)跟 GPU 在技术理念上有很多相似之处:都是通过特定优化的、高效能的小 CPU 核组成的众核系统,并行的完成计算任务。根据“指令”复杂度,从 CPU 到 ASIC 的划分,NP 和 GPU 处于相同的位置。

NP 具有如下的一些不足:

  • 性能。虽然相比 GPU,性能是在同一层级,但相比 ASIC/DSA 性能不够。

  • 场景。NP主要用于网络场景的处理,没有像 GPU 那样作为通用并行计算,GPU可以用于非常多的高性能场景。

  • 开发和生态。GPU 由于 NVIDIA CUDA 的强大生态,框架、工具链、开发库都非常成熟。而 NP 由于生态的不成熟,以及各家 NP 之间也基本互不兼容,开发者需要了解底层的硬件细节,致使编程难度很大。

NP 在网络领域有一定范围采用,但网络领域更主要的处理引擎是网络 ASIC,这些年还兴起网络数据面可编程的网络 DSA,都是相比 NP 架构具有更极致的性能。正因为 NP相比 ASIC/DSA 的性能不足,以及相比 GPU 覆盖的场景有限,这样的 “高不成,低不就”,导致其一直没能成为(相比 GPU 而言)主流的通用计算平台。

谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?

DSA

DSA 针对特定应用场景定制处理引擎甚至芯片,支持部分软件可编程。DSA 与 ASIC 在同等晶体管资源下性能接近,两者最大的不同在于是否可软件编程。ASIC 由于其功能确定,软件只能通过一些简单的配置控制硬件运行,其功能比较单一。而 DSA 则支持一些可编程能力,使得其功能覆盖的领域范围相比 ASIC 要大很多。

DSA,一方面可以实现 ASIC 一样的极致性能,另一方面,可以像通用 CPU 一样执行软件程序。当然,DSA 只会加速某些特定领域应用程序。例如:用于深度学习的神经网络处理器以及用于 SDN 网络可编程处理器。

CPU、GPU和DSA的优劣势分析

谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?

蓝海大脑液冷GPU服务器搭载于 NVIDIA 4 × A100 / 3090 / P6000 / RTX6000;使用 NVLink + NVSwitch 的最高GPU通信;4个用于 GPU Direct RDMA 的 NIC(1:1 GPU比率);最高4 x NVMe 用于 GPU 系统盘,带有 AIOM;双电源冗余供电系统、防雷击、防浪涌保护。

3 面向未来十年的新一代计算架构

未来十年的新一代计算架构的一些设计目标——基于软硬件融合架构(CASH,Converged Architecture of Software and Hardware)的超异构计算:

1.性能。让摩尔定律继续,性能持续不断地提升。相比 GPU,性能再提升100+倍;相比 DSA,性能再提升10+倍。

2.资源效率。实现单位晶体管资源消耗下的最极致性能,极限接近于 DSA/ASIC 架构的资源效率。

3.灵活性。给开发者呈现出的是极限接近于 CPU 的灵活性、通用性及软件可编程性。

4.设计规模。通过软硬件融合的设计理念和系统架构,驾驭 10+ 倍并且仍持续扩大的更大规模设计。

5.架构。基于软硬件融合的超异构计算:CPU + GPU + DSA + 其他各类可能的处理引擎。

6.生态。开放的平台及生态,开放、标准的编程模型和访问接口,融合主流开源软件。

谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?

4 宏观算力建设

数字经济时代,不断增强算力,不断降低算力成本。一方面,我们可以以相同的价格,可以获得更多更丰富的算力;另一方面,是降低算力获取门槛,实现算力普惠。

持续不断的提升算力,降低成本,实现算力普惠

随着数字经济建设逐步深入,对算力需求不断提高。在功耗和成本不变情况下,通过架构创新,提升芯片性能。如果我们能够把芯片性能提升10倍,在同样规模下,意味着10倍的宏观算力提升,也意味着单位算力成本和功耗均降低到1/10。也就意味着,对用户来说,可以以同样价格获得更多更丰富算力资源。

芯片一次性成本极高,芯片通用性可以确保芯片大规模复制。而大规模复制的芯片,就意味着无限摊薄芯片的研发成本。性能提升,成本降低,一里一外的优势,确保芯片核心竞争力。

并且,通过算力提升,以及成本和功耗降低,可以降低算力使用门槛,使得更多用户能够享受算力的便捷。在数字经济世界里,大家共享技术发展带来价值红利。

建设宏观经济,首先需要的是IT基础设施。蓝海大脑作为中国领先的IT基础设施提供商,可以提供服务器、存储、网络、5G云网融合产品等IT基础设施。文章来源地址https://www.toymoban.com/news/detail-411839.html

到了这里,关于谁能在第四代算力革命中脱颖而出?CPU?GPU?算法?数据?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 传统数据库逐渐“难适应”,云原生数据库脱颖而出

    数据库一直是应用开发中非常重要的一部分。从MySQL到亚马逊的RDS(关系型数据库服务,Relational Database Service),业界有很多数据库系统供开发者存储、查询和管理数据。随着海量计算的持续发展,给传统数据库带来了不少挑战,而云原生数据库却可以应对这些挑战。 亚马逊云

    2024年01月22日
    浏览(50)
  • AI绘画兴起,Stable Diffusion脱颖而出,来一探究竟

    近几年,AI图像生成风靡全球,它能够根据文字描述生成精美图像,这极大地改变了人们的图像创作方式。众多专业人士说该技术正在引领着新一轮深度学习创意工具浪潮,并有望彻底改变视觉媒体的创作。 AI绘画兴起 Stable Diffusion脱颖而出 目前文生图的主流AI绘画平台主要有

    2024年02月15日
    浏览(47)
  • 掌握SEO优化:让您的网站在搜索引擎中脱颖而出

    导言: 在当今数字化的时代,搜索引擎成为了人们获取信息的主要途径。作为网站拥有者,如何让您的网站在搜索引擎结果中排名靠前,成为用户首选,就显得尤为重要。这就需要掌握搜索引擎优化(SEO)的技巧。本文将为您介绍一些关键的SEO优化方法,帮助您提升网站在搜

    2024年02月11日
    浏览(94)
  • 决策编码与人工智能的市场竞争:如何在竞争激烈的环境中脱颖而出

    人工智能(Artificial Intelligence, AI)是一种能够使计算机自主地理解、学习和应对复杂任务的技术。决策编码(Decision coding)是一种在人工智能领域中广泛应用的方法,它旨在帮助计算机模拟人类的决策过程,以实现更高效和智能的系统。 随着人工智能技术的不断发展,市场竞争也

    2024年02月20日
    浏览(50)
  • MyBatis进阶:掌握MyBatis动态SQL与模糊查询、结果映射,让你在面试中脱颖而出!!

    目录 一、引言 二、MyBatis动态SQL 2.1.if元素使用 2.2.foreach元素使用 三、MyBatis模糊查询 ①使用#{字段名} ②使用${字段名} ③使用concat{\\\'%\\\',#{字段名},\\\'%\\\'} 总结 四、MyBatis结果映射 4.1.案例演示 4.1.1.resultType进行结果映射 4.1.2.resultMap进行结果映射 在当今的软件开发环境中,数据库的使

    2024年02月11日
    浏览(46)
  • 龙头公链SOL:凭实力在币圈脱颖而出,它是不是你心中的白月光呢?

    在币圈,永远不缺机会,缺的是发掘项目并静下心来了解机会的意愿,判断机会的眼光,尝试机会的勇气,坚持机会的恒心,以及相信自己的信念。只不过当机会来临时,往往都失之交臂,事后又追悔莫及。   今天就来聊聊Solana 早在2019年,Solana完成A轮融资,融资金额达到了

    2023年04月18日
    浏览(44)
  • 【算力革命】算力架构

    AI芯片可按架构分为CPU、GPU、FPGA、ASIC,各架构的优缺点可参考以下文章: CPU、GPU、FPGA、ASIC等AI芯片特性及对比_cpu gpu fpga_maopig的博客-CSDN博客 最近,新名词 DSA(Domain Specific Architecture,特定领域架构),可参考以下文章: https://mp.weixin.qq.com/s/dw0Btk126Ime6BF3zDVvJQ 如何让算力提升

    2024年02月15日
    浏览(31)
  • 关于Unity动画卡在第一帧的处理方法

    今天在制作人物的死亡动画时出现了题目所说的问题,以下是动画的状态机 因为任何状态都可能死亡,所以是从anyState进入的死亡动画 进入条件为isDead是true,当角色死亡时这个条件就会设置成true 结果出现了卡在这个动画的问题 经过检查发现,其实是进入死亡动画后,isDe

    2024年02月12日
    浏览(44)
  • PDF换行的难度,谁能解决?

    换行的时候确认不了长度: 运行结果: 宽度 str1: 444 宽度 str2: 364 宽度 str3: 441 宽度 str4: 312 这些长度在pdf里面都是一样的,但是这里运行的宽度确实不同的,目前这个问题还解决不了。

    2024年02月13日
    浏览(44)
  • 被泼冷水后,谁能超越微服务?

    历史总会重演。一切刚过去的,又会被重新提起。开源项目Codename One的联合创始人Shai,曾是Sun Microsystems开源LWUIT项目的共同作者,参与了无数开源项目。作为最早一批Java开发者,最近感慨道:单体,又回来了! Shai说道:我已经在这个圈子里很久时间了,看到了一次次被抛弃

    2024年02月15日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包