【ARM Cache 系列文章 9 番外篇 -- ARMv9 Core 介绍】

这篇具有很好参考价值的文章主要介绍了【ARM Cache 系列文章 9 番外篇 -- ARMv9 Core 介绍】。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


请阅读【ARM Cache 系列文章专栏导读】

ARMv9 TCS21 平台

2021年5月Arm公布了其最新3款CPU和3款GPU核心设计,三款新 CPU 分别是旗舰核心 Cortex-X2、高性能核心 Cortex-A710、高能效核心Cortex-A510 CPU,三款新GPU核心则覆盖高中端和入门级。

这是继2021年3月推出重要的创新——全新64位指令集Armv9、2021年4月推出基于Armv9的首个产品——面向数据中心的Neoverse N2之后,Arm首次展示基于Armv9设计的一系列面向消费级移动设备市场的新核心,这些新设计不仅性能大幅提升,而且增加新的安全性和人工智能(AI)功能。

  • Cortex-X2,它是Arm Cortex-X定制项目的一部分,允许合作伙伴帮助为其特定用例设计专用核心。作 为Cortex-X1 的继任者,它也是Arm CPU产品线中强大的设计,可以用于笔记本电脑等大屏设备。Arm称,与Cortex-X1比,Cortex-X2的性能将提高16%,机器学习性能提升2倍;
  • Cortex-A710 “big” 核心 比 Cortex-A78 提高10%的性能、30%的能效、2倍的机器学习性能;
  • Cortex-A510 “LITTLE” 高能效核心 取代自2017年推出的Cortex-A55设计。与老款A55相比,其性能提升35%,能效提高20%,机器学习性能提升3倍。

高通骁龙888芯片,即采用 Arm Cortex-X1 和Cortex-A78的部分定制版本作为其四个“大”核心,并使用Cortex-A55设计作为其“LITTLE”核心。

X2、A510都将是纯64位,不再兼容32位,而A710会继续支持OL0 AArch32。其中,X2和A710的前端都改进了分支预测,精度更高,错误更少。

凭借 L3 缓存和丛簇设计 DSU-110 的特性,单一丛簇(cluster)最多可容纳8个X2 核心,并具有最大 16MB 的 L3快取能力。

ARM Cortex-A510 介绍

Cortex-A510 是一个更大的微体系结构跳跃,因为它代表了Arm的 Cambridge CPU 设计团队的一项新的 CPU设计。A510 在改进 IPC的同时仍继续关注功率效率,并且也许最有趣的是,它保留了其有序的微体系结构特征。

A510则采用了一个混合核心微架构merged core microarchitecture)新设计,可将2个A510组合成一个群组,单一CPU可由多个群组构成,从而实现更加弹性化的结构设计。两个核心对它们共享L2缓存系统以及它们之间的FP / NEON / SVE pileline。
【ARM Cache 系列文章 9 番外篇 -- ARMv9 Core 介绍】,# ARM CPU Cache 系列,ARMv9 core,A710,A720,A510,A520,Cortex-A720,Cortex-X4

ARM 的 Merged-Core Microarchitecture 是 ARM 设计的新型微架构。这种微架构的主要特点是将多个物理核心合并为一个逻辑核心,以提高处理器的能效和性能。

在Merged-Core Microarchitecture中,每个物理核心都可以独立运行指令,但是所有的物理核心都共享同一个指令流。这样,当某个物理核心空闲时,它可以被用来执行其他核心的指令,从而提高整体的处理器性能。

ARMv9 TCS22 平台

2022 年 6 月 ARM 发布了 Cotrex-X3A715A510 v2 处理器,还有 Immortalis-G715Mali-G715Mali-G615等GPU,统称为TCS22平台,号称游戏性能提升28%,功耗降低了16%,内存带宽要求也减少了23%。不过这一代的ARM CPU及GPU其实底层的架构都没多大改进,整体还是2021的优化版。
【ARM Cache 系列文章 9 番外篇 -- ARMv9 Core 介绍】,# ARM CPU Cache 系列,ARMv9 core,A710,A720,A510,A520,Cortex-A720,Cortex-X4

与 2021全面计算解决方案(TCS21)相同,Arm 推出的 TCS22也是面向所有消费级设备市场,并且持续专注于计算性能、开发者对性能的可及性,以及平台的安全性。

  • 首先,鉴于 OPPO、vivo 和小米等公司参与的中国金标联盟宣布,中国的计算生态系统和应用生态系统已全面就绪64位。这意味着,未来几年的旗舰级智能手机都需保证为全64位设计,以确保获得最佳的效率和最强的性能。

  • 其次,Arm为了让开发者获得IP在机器学习性能方面的更新与提升,便不断推进Arm计算库和Arm NN框架,以确保开发者能够访问这些性能。无论是在GPU中的矩阵乘法的改善,还是在系统级优化和设计中其它地方的缓存微调中,Arm计算库和Arm NN框架都能让开发者获取这些性能。

  • 第三,在安全性方面,Arm 一直在加强处理内存的安全性。此外 ARM 还将这些保护措施扩展到设计中较小的可信执行环境中,这是系统执行软件栈中可能最具安全意识组件的地方。像人脸解锁和面部识别这样的功能,需要确保其免受额外的恶意攻击。

CPU多核互联架构依然是Hayden,也就是DSU-110系列,手机及平板上常见的组合是1+3+4核心,笔记本上最高可以做到8+4+0,12核架构,而且8个都是超大核。

小核是是在 A510 基础上小改的 A510 v2。

ARM Cortex-A715

2022年8月 Arm 推出了他们的大核 Cortex-A715(也称为 Makalu)。A715 支持与 ARMv9.0 ISA 大致相同的几项增强功能。更关键的是,A715的所有Exception Level都是仅支持AArch64(完全放弃了 32 位支持)。A715 的设计原则与之前的大核心相似:以更高的比率提高性能,而不是影响功率和面积。在这次迭代中,性能重点放在了整体改进上,而没有显着拓宽pipeline 或extending its depth。最后,Arm 工程师引入了受早期 Cortex-X 设计启发的有针对性的改进,例如分支预测器和预取增强功能。

A715 的另一项改进是引入了 3 阶段预测方案以实现快速周转。以前,Arm 具有快速的 L0 0 周期预测和较慢的 2 周期预测结构,而在 A715 中,Arm 将其分解为三个阶段,采用新的 1 周期周转中间结构,从而减少了获得预测的延迟。

随着更高容量的分支预测器产生更高的分支请求带宽,可能会遇到更多获取两个单独指令流的实例。为了适应这一点,A715 现在支持更高的指令高速缓存查找带宽,最高可达标签/周期的两倍。

高通的骁龙 8 Gen2 选择使用了 Arm 的 Cortex-X3、Cortex A715/710 和 Cortex-A510 内核集群。

ARMv9 TCS23 平台

2023年5月 在台北 ComputeX 展会期间 Arm 展示了基于TSC23平台的 下一代 Cortex-A 和 Cortex-X 系列 CPU 内核 —— 以及新一代 GPU 设计,从今年下半年到明年间成为产品。昨天的发布包括旗舰级超大核 CXC23, 也就是 Cortex-X4 内核、大核 Cortex-A720、小核 Cortex-A520 以及新一代 GPU Immortalis-G720。大核的架构代号 Hunter 猎人,是 A715 核心的继任者。小核代号 Hayes的架构。
【ARM Cache 系列文章 9 番外篇 -- ARMv9 Core 介绍】,# ARM CPU Cache 系列,ARMv9 core,A710,A720,A510,A520,Cortex-A720,Cortex-X4

对于其 2023 的年度 IP,Arm 正在通过其 Cortex 内核系列推出一波次要的微架构改进,这些细微的变化旨在提高效率和性能,同时完全转向 AArch64 64 位指令集。

除了改进 CPU 内核外,Arm 还使用 DSU-120 对其 DynamIQ Shared Unit 内核复合块进行了全面升级。尽管引入的修改很细节,但它们在提高结构效率方面具有重要意义,同时进一步扩展了 Arm 的应用范围,支持单个块中多达 14 个 CPU 内核:此举旨在使 Cortex-A/X 更适合笔记本电脑。
【ARM Cache 系列文章 9 番外篇 -- ARMv9 Core 介绍】,# ARM CPU Cache 系列,ARMv9 core,A710,A720,A510,A520,Cortex-A720,Cortex-X4

Arm Cortex-X4

在不同 CPU 核心的升级中,大核 Cortex-X4 最引人关注。从最初的 Cortex X1 内核开始,Arm 每次迭代中在每周期指令 (IPC) 方面都能取得两位数的百分比性能提升,2023 年的 Cortex-X4 也是如此(13%),Cortex-X4 专用于旗舰安卓智能手机和领先的移动设备。

Cortex-X4 旨在为移动片上系统(SoC)提供顶级算力,特别适合处理大型游戏或突发负载。Cortex-X4 是 Arm 迄今为止性能最高的内核,具有预计 3.4 GHz 时钟速度和更大的 L2 缓存,与去年的 1 MB 相比容量翻了一番,达到 2 MB。尽管有这些改进,为提升性能核心物理尺寸仍有增加,更复杂的 X4 CPU 核心的裸片尺寸增加不到 10%(不包括额外的 L2 缓存)。
【ARM Cache 系列文章 9 番外篇 -- ARMv9 Core 介绍】,# ARM CPU Cache 系列,ARMv9 core,A710,A720,A510,A520,Cortex-A720,Cortex-X4
至于电源效率,Arm 声称与前几代产品相比效率大幅提升了约 40%,不要指望看到太多芯片厂商利用这一点,因为 X 系列的主要工作是高负载。

在架构方面,Cortex-X4 与 Cortex-X3 有相似之处,主要侧重于改进现有架构并优化各种核心组件的效率。Cortex-X4 前端已重新洗牌并调整了指令获取块,Arm 的目标是保持低延迟,同时在其 Cortex-X4 内核和整个 TSC23 内核集群中提供峰值带宽。

Cortex-X4 前端的重大架构变化体现在其调度宽度上。Cortex-X4 现在具有更集中的 10-wide 调度宽度,最高可达 X3 的 6/8-wide 调度宽度。也就是说,尽管前端变宽了,但有效流水线长度实际上却略微缩短了,分支预测错误的惩罚从 11 个周期减少到 10 个。

前端的另一个重点是指令获取过程本身。与 Cortex-X3 相比,Arm 基本上重新设计了整个指令获取传送系统,以确保整个流水线的效率更高。

最新的架构还对 Arm 的分支预测单元进行了另一次改进,进一步提高了它们的预测准确性,但这一切都不是免费的午餐,Arm 很快注意到改进后的预测器的实施成本更高。尽管如此,Arm 认为,为了提供性能这是值得的。

Cortex-A720

Cortex-A720 与去年的 Cortex A715 设计相比并没有太大变化,它首先也是 Arm 首款纯 AArch64 的中核。Arm 对 A700 系列的理念主要是通过优化提高性能,在设定的热限制内提供最高水平的电源效率,并针对实际用例优化工作负载,而不是极快的基准性能。
【ARM Cache 系列文章 9 番外篇 -- ARMv9 Core 介绍】,# ARM CPU Cache 系列,ARMv9 core,A710,A720,A510,A520,Cortex-A720,Cortex-X4
与 Cortex-X4 类似,Cortex-A720 是围绕 Armv9.2 ISA 构建的,Arm 优化了其设计,使 A720 能够在相同的功率预算内提供比 Cortex A715 更高的性能。Arm 700 系列通常涵盖范围更广的应用并迎合各种市场,包括但不限于数字电视、智能手机和笔记本电脑。为了在更多样化的空间中拥有更大灵活性,Arm 希望通过 Cortex-A720 充当 TSC23 核心集群的「主力」。

对于 Cortex-A720,Arm 还提供了多种配置选项。除了标准的、性能最高的选项外,Arm 还拥有所谓的「入门级」配置,可将 A720 缩小到与 Arm Cortex-A78 相同的尺寸,同时仍将整体性能提升 10%。由于一些 Arm 客户对裸片尺寸特别严格,因此有必要采取此类举措来说服他们最终转向 Cortex-A7xx 系列和 Armv9。
【ARM Cache 系列文章 9 番外篇 -- ARMv9 Core 介绍】,# ARM CPU Cache 系列,ARMv9 core,A710,A720,A510,A520,Cortex-A720,Cortex-X4

Cortex-A520

Armv9.2 内核中的第三个是 Cortex-A520,它的设计很少,但 Arm 承诺比前几代有很大改进,尤其是在能效方面。

最大的问题解决了吗:并没有,Cortex-A520 不是乱序内核设计。忠于 Arm 的小核心设计理念,它仍然是有序核心 —— 事实上,Arm 甚至在此过程中移除了 ALU。

Arm 这一代的最小内核实际上是一个新内核,但它更多的是对 Cortex-A510 的改进,而非全新的设计。在已发布的所有三个 Cortex Armv9.2 内核中,它的功率面积比最低。最明显的差异来自功率优化,Arm 声称 Cortex-A520 在等进程和等频率下的能效比之前的 Cortex-A510 内核高 22%。Arm 的 TCS23 目录中的小内核主要是为执行低强度和后台操作任务而设计的,它可以减轻 Cortex-A720/Cortex-X4 等较大内核的负载,从而提高集群内的整体能效。
【ARM Cache 系列文章 9 番外篇 -- ARMv9 Core 介绍】,# ARM CPU Cache 系列,ARMv9 core,A710,A720,A510,A520,Cortex-A720,Cortex-X4

ARMv9 TCS24 平台

在2024年超大核则是CXC24,应该是 Cortex-X5 超大核了。2024年大核的架构代号则会使Chaberton,具体型号名就不确定。
【ARM Cache 系列文章 9 番外篇 -- ARMv9 Core 介绍】,# ARM CPU Cache 系列,ARMv9 core,A710,A720,A510,A520,Cortex-A720,Cortex-X4

推荐阅读
https://aijishu.com/a/1060000000365445
https://cloud.tencent.com/developer/article/2293461文章来源地址https://www.toymoban.com/news/detail-679836.html

到了这里,关于【ARM Cache 系列文章 9 番外篇 -- ARMv9 Core 介绍】的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Armv9读取cache内容:Direct access to internal memory

    快速链接: 【精选】ARMv8/ARMv9架构入门到精通-[目录] 👈👈👈 10 访问cache Cortex-A720核心提供一种机制,通过IMPLEMENTATION DEFINED系统寄存器可以读取L1缓存、L2缓存和Translation Lookaside Buffer(TLB)。当缓存数据与系统内存数据之间的一致性异常时,您可以使用此机制来调查任何问题

    2024年04月24日
    浏览(34)
  • Armv9 Cortex-A720的L2 memory system 和 L2 Cache

    快速链接: . 👉👉👉 个人博客笔记导读目录(全部) 👈👈👈 付费专栏-付费课程 【购买须知】: 【精选】ARMv8/ARMv9架构入门到精通-[目录] 👈👈👈 联系方式-加入交流群 ---- 联系方式-加入交流群 9 L2 memory system Cortex-A720核心的L2内存系统通过CPU bridge连接core与DynamIQ Shared Unit-1

    2024年02月07日
    浏览(35)
  • 【ARMv9 DSU-120 系列 4.2 -- Utility Bus 访问的 memory-mapped 寄存器详细介绍】

    请阅读 【Arm® DynamIQ™ Shared Unit-120 专栏 】 ARMv9架构中的DSU-120(DynamIQ™ Shared Unit-120)提供了一组Cluster系统控制寄存器,这些寄存器可以通过两种方式访问: 通过Utility Bus上的内存映射访问 :允许外部设备或核心之外的系统与DSU-120的控制寄存器进行交互。 通过核心的系统寄

    2024年04月29日
    浏览(22)
  • Postman系列番外篇 - postman web版介绍及与PC版的对比

    近期postman官方推出了postman web版本,无需安装客户端即可使用 那么web端的postman可以替代pc版的postman吗? 打开postman的下载页面:https://www.postman.com/downloads/ 在下载按钮之下还有一个标题“Postman on the web”(使用web版postman) 点击下方按钮“Try the Web Version” 进入web版 postman 的主

    2024年02月02日
    浏览(42)
  • 【ARM Cache 系列文章 9 -- ARM big.LITTLE技术】

    转自 :https://zhuanlan.zhihu.com/p/630981648 如有侵权,请联系删除 为满足在移动设备应用领域中的节能需求,ARM于2011年首次提出了big.LITTLE技术。big.LITTLE技术是一种使用两种不同ARM处理器的处理架构技术,即big处理器和LITTLE处理器,big处理器用于提供高性能,LITTLE处理器用于追求

    2024年02月13日
    浏览(32)
  • 【ARM Cache 系列文章 2 -- Cache Coherence及内存顺序模学习】

    请阅读 【ARM Cache 系列文章专栏导读】

    2024年02月16日
    浏览(42)
  • Arm机密计算架构技术(Armv9 CCA) 白皮书

    快速链接: . 👉👉👉 个人博客笔记导读目录(全部) 👈👈👈 付费专栏-付费课程 【购买须知】: 【精选】ARMv8/ARMv9架构入门到精通-[目录] 👈👈👈 联系方式-加入交流群 ---- 联系方式-加入交流群 1. 概述 在本篇文章中,我们将介绍机密计算(Confidential Computing)在现代计算平台

    2024年02月07日
    浏览(38)
  • Armv8/Armv9从入门到精通-课程介绍

    通知,Arm二期,咱们也有大合集PDF了,共计1587页,还未完成,后续持续更新和优化中。为了方便大家阅读、探讨、做笔记,特意整了此合集PPT,为了增加标签目录,还特意开了福兮阅读器会员。 以下是此课程的介绍: 1、全体系的掌握ARMv8/ARMv9的核心知识点(ARM基础、异常中断

    2024年02月03日
    浏览(36)
  • Armv9的RME安全架构介绍

    (Realm management extension,1万5千字深度解剖Armv9的RME安全架构) :CCA、RME、机密计算、服务器、MPAM、RAS、GPC、GPT、内存管理、Completer-Side、optee、RAS、ATF、TF-A、Trustzone、optee3.20、MMU、VMSA、cache、TLB、arm、armv8、armv9、TEE、安全、内存管理、页表 快速链接: . 👉👉👉 个人

    2024年02月16日
    浏览(28)
  • Arm发布最新内核 : Corte-X4/A720/A520,支持Armv9.2

    1、背景 Arm 是一家设计智能手机的CPU内核的公司,并且每年它都会进行新的迭代,这些迭代随后将集成进芯片SOC,例如当年的旗舰 Snapdragon 、 MediaTek Dimensity。2023年,发布了新的旗舰级内核: Cortex-X4 超大核、Cortex-A720 性能大核和 Cortex-A520 功耗小核。这些core构成了公司新的

    2024年02月17日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包