功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标

这篇具有很好参考价值的文章主要介绍了功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

在玩家要求游戏更流畅、画质更精美的今天,优化GPU过度使用导致的性能问题成了大多数游戏开发团队关注的核心。当项目的GPU压力达到一定阈值时,卡顿、掉帧、发热、降频等问题便随之而来,严重影响用户体验。

为了解决项目的GPU压力问题,UWA GOT Online Overview模式中已推出的GPU Counter功能,展示GPU负载、着色、带宽、图元等参数,帮助开发者对GPU性能压力进行更详细的分析。在最新版UWA SDK 2.4.7中,UWA进一步新增了SoC GPU信息功能和更多GPU Counter数据,在宏观监控GPU压力的同时,更全面、更准确地定位GPU压力来源。下面将详解SoC GPU信息和GPU Counter相关数据的解读和UWA建议。

需要注意的是,基于各个厂商的GPU架构不同,同一参数在不同品牌芯片上的推荐值也会存在差异,不同设备间横向对比的意义不大,UWA更推荐大家在相同的设备上进行纵向对比。

SoC GPU信息

在SoC GPU信息模块下,开发者可以从更宏观的角度对设备的GPU运行情况进行监控,在观察GPU运行状态、判断是否存在GPU降频情况的同时,也可以快速定位GPU压力较大的场景,以便更有针对性地进一步分析这些场景的性能压力来源。

SoC GPU信息目前仅支持MTK SoC设备和安卓10及以上的HISI SoC设备,具体支持设备列表可通过下图或登录UWA官网对“GOT Online支持设备列表”列表进行查询:
https://www.uwa4d.com/main/supported.html

功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标

GPU频率
GPU频率(GPU Freq)表示当前采样帧GPU的工作频率,不同型号和厂商的GPU具有不同的额定最大频率,且GPU会动态调整工作频率。开发者可以通过GPU频率观察GPU的工作情况,结合GPU Counter下的具体参数,快速判断GPU是否处于正常工作状态。

功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标

GPU负载
GPU负载(GPU Utilization),表示当前GPU频率相对于GPU额定最大频率的百分比,该参数走势和GPU频率走势一致。

当GPU负载持续较高时,说明设备持续处于高压场景,长期处于这种情况会容易引起GPU过热,造成游戏性能表现下滑,需要开发者结合GPU Counter模块重点关注这些场景的GPU压力。

功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标

需要注意的是,SoC下的GPU负载体现的是GPU整体运行层面的负载情况,Mali/PowerVR GPU Counter下的Fragment和Non-Fragment负载(具体参考:《GPU Counter功能更新|支持Adreno、PowerVR芯片》)则是体现了GPU内部的两个主要工作单元的负载情况,各自代表了不同层面下的GPU负载情况,分析时需要根据对应的层面综合分析。

MTK GPU利用率
在MTK SoC设备上,UWA支持GPU利用率(GPU Loading),表示GPU的时钟周期数占当前可用时钟周期数的百分比,即当前额定频率的利用率。需要注意的是,GPU利用率仅表示当前频率下GPU的使用情况,而非GPU压力情况。

功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标

HISI DDR频率
在HISI SoC设备上,UWA支持DDR频率(DDR Freq)参数,表示设备系统内存频率,而DDR的工作状态也会影响到GPU的性能释放。

功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标

GPU Counter

GPU Counter则是对GPU下各个模块的数据进行了更全面的补充。在此次更新中,UWA新增了GPU活动、GPU着色、GPU缓存三项性能参数,同时补充了之前版本下不同厂商的数据。在进一步完善了GPU数据的全面性和准确性的同时,也可以使开发者可以更便捷地定位项目的性能瓶颈、制定性能标准。

GPU活动
在Mali/PowerVR/Adreno GPU Counter页下,都新增了GPU活动参数,即GPU Clocks,表示渲染一帧耗费的GPU时钟周期数,是用于衡量GPU性能的主要指标。通过GPU Clocks,开发者可以快速定位项目的GPU压力主要来自哪些场景,并结合GPU Counter下的其他参数对GPU压力情况进行具体分析。

功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标

GPU着色
在Mali/PowerVR/Adreno GPU Counter下的GPU着色页下,都新增了Fragment shaded和Vertices shaded两项指标。Mali/PowerVR下已有的Cycles/Pixel可以表示项目的平均每像素复杂度,新增的Fragment shaded和Vertices shaded则可以从另一个方面体现项目的Overdraw情况。

其中Fragment shaded表示每帧Fragment shader执行了多少次,用Fragment shaded数除以设备分辨率,可以侧面反映项目的Overdraw情况。

当Overdraw较高时,容易引起发热和能耗方面的问题。我们可以通过降低半透明粒子特效的粒子数量、使用不规则面片代替矩形面片渲染粒子特效或UI等方式,减少项目的Overdraw层数,降低GPU压力。

功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标

而Vertices shaded则表示每帧Vertex shader执行了多少次。使用Vertices shaded除以输入图元数,即可得到平均每个图元进行了多少次Vertices shaded。UWA推荐平均每个图元执行次数应控制在1.5次以下。

功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标

Mali GPU缓存
Mali GPU缓存包括Read Stall和Write Stall两项数据,分别表示外部读、写事件上GPU处于等待状态周期数占总周期数的百分比。即当GPU向系统内存发出请求时,系统内存没有及时响应,等待时间占GPU活动时间百分比。

功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标

GPU缓存情况可以直接体现GPU带宽压力:Read Stall和Write Stall越低,GPU运行状态越好,UWA建议这两项参数应各自控制在5%以下。

当Read Stall较高时,说明此时GPU存在较明显的带宽压力,开发者可以通过降低目标帧率、减少纹理资源与网格资源的大小和数量等方式对带宽压力进行优化;当Write Stall较高时,则可以降低网格复杂度,或通过控制Framebuffers的数量与内存大小进行优化。

PowerVR GPU缓存
PowerVR GPU缓存则是增加了GPU Memory Bus Utilization参数,即每帧GPU内存总线负载。它表示当前GPU带宽消耗占总可用带宽的百分比。

当GPU Memory Bus Utilization持续较高时,说明GPU访问内存的频率过于频繁,可以通过减少纹理资源与网格资源的大小和数量控制GPU缓存的占比。

功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标

Adreno GPU缓存
Adreno GPU缓存在原有的基础上新增了Texture L2 Cache Miss,以便开发者对缓存命中情况进行更全面考量。关于Texture L1 Cache Miss的定义和优化方式,可以参考之前的文章:《GPU Counter功能更新|支持Adreno、PowerVR芯片》。

功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标

除了上述新功能外,UWA还在Adreno GPU Counter下新增了GPU带宽、在PowerVR GPU Counter下新增了GPU负载功能。由于这两个参数的数据含义和优化方式与其他GPU Counter一致,此次不再赘述,大家可以通过以下往期文章查看。

GPU带宽:《GPU Counter、Timeline功能上线 | 性能优化快人一步!》
GPU负载:《GPU Counter功能更新|支持Adreno、PowerVR芯片》

提示:在测试开始前,部分设备可能会弹出无法正常获取GPU Counter的提示,建议大家查看用户手册中的《1.3本地测试-注意事项》篇,对GPU Counter采集异常的情况进行排查,并根据文档中的方法尝试获取GPU Counter数据。

如果您对新功能感兴趣,请前往UWA官网下载SDK,下载链接:
UWA | 致力于游戏VR和AR应用提供项目研发解决方案 | 简单优化、优化简单 | 侑虎科技

相关推荐

《功能上新|内存篇:PSS显存、内存占用、堆内存对象快照》文章来源地址https://www.toymoban.com/news/detail-469753.html

到了这里,关于功能上新| GPU篇:SoC GPU信息、GPU Counter性能指标的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • unity学习(77)--多玩家信息交互--不同类型的数据包

    明白各个数据包的作用,以及是否正确的发挥作用 1. “120包” ,客户端登录时发给服务器的,服务器处理后返回“121包”。 2. “121包” ,服务器返回给客户端的,包含登录时所有在线玩家的信息。 客户端也通过createPlayer函数成功初始化了自己的gameobject。 3.“ 122包 ”,服

    2024年04月26日
    浏览(29)
  • [架构之路-14]:目标系统 - 硬件平台 - CPU、MPU、NPU、GPU、MCU、DSP、FPGA、SOC的区别

    目录 前言: 一、通用指令程序控制 1.1 CPU(Central Processing Unit:中央处理单元/器) 1.2 MPU(Microprocessor Unit:微处理单元/器)-- 广义CPU 1.3 MCU(Mirco Controller Unit:微控制单元)-- 单片机 二、网络协议处理器NPU 2.1 npu = network processing units:网络处理单元 2.2 npu = neural-network proces

    2024年02月01日
    浏览(71)
  • 浪潮信息自研服务器操作系与万里安全数据库软件完美兼容 功能及性能俱佳

    日前,由浪潮信息自主研发的服务器操作系统Inspur KOS V5与万里安全数据库软件GreatDB V1.0、V5.1完成兼容性互认证测试,两款产品均展现出了优异的兼容性能及高效的运行效果,在用户数据安全、产品可控等数字化转型和可靠性需求上皆能为客户提供更全面的解决方案。 构建优

    2024年02月10日
    浏览(41)
  • 安全运营中心(SOC)的核心功能

    安全运营中心(SOC)的核心功能主要体现在以下几个方面: 安全事件监测与响应 :SOC通过部署在安全基础设施上的传感器、日志收集器和安全设备,实时收集和分析网络流量、系统日志、用户行为等数据,以便及时发现并响应各种安全事件。这些事件可能包括恶意软件感染

    2024年04月12日
    浏览(46)
  • 汽车信息安全运营中心VSOC 与 传统SOC:相同但不同

            汽车网络安全终于到了大放异彩的时候了。即将推出的新法规和标准,以及不断扩大的汽车网络攻击规模,正在优先考虑在全球领先的原始设备制造商之间建立网络安全运营。原始设备制造商正在迎接挑战,其中许多已经在运营或正在建立他们的车辆安全运营中心

    2024年02月07日
    浏览(48)
  • 系统配置与性能评价>性能指标

    性能指标,是软、硬件的性能指标的集成。在硬件中,包括计算机、各种通信交换设备、各类网络设备等;在软件中,包括:操作系统、协议以及应用程序等。 1、计算机 对计算机评价的主要性能指标有:时钟频率(主频);运算速度;运算精度;内存的存储容量;存储器的

    2024年02月07日
    浏览(39)
  • 性能测试指标之业务指标和技术指标如何进行区别

    通过业务指标 转化我们的技术指标,用户  第三方客户, 公司内部产品经理 产品经理  会提出产品业务指标,需要对业务指标进行挖掘,提出测试场景 业务指标会转化成相对应的技术指标 时间指标 平均响应时间  最大响应时间  最小的响应时间 每一秒钟处理的事务数 T

    2023年04月18日
    浏览(57)
  • 性能优化 - 前端性能监控和性能指标计算方式

    利用LightHouse进行合理的页面性能优化 这篇文章主要讲解了如何使用 Lighthouse 。 这里把相关图片再展示一下: 我们可以看到 Lighthouse 计算的时候,会根据这几个维度的指标来计算总分。那么本篇文章,就主要讲解下前端性能监控相关的重要指标含义和计算方式。 在介绍指标

    2024年02月15日
    浏览(62)
  • 【性能测试】关于性能测试的各种指标

    本指标适用于使用性能测试进行性能测试项目技术质量评价依据,规范技术测试结果评价,统一性能测试技术测试质量度量。应用系统技术质量度量指标范围广泛,本文难以涵盖全部。 预期读者为测试管理人员、测试实施人员、技术支持人员、项目管理人员等系统技术质量相

    2024年04月23日
    浏览(46)
  • 项目性能优化—性能优化的指标、目标

    性能优化的目标实际上是为了更好的用户体验: 一般我们认为用户体验是下面的公式: 用户体验 = 产品设计(非技术)+ 系统性能 ≈ 系统性能 = 快 那什么样的体验叫快呢? 一般我们认为网站页面的加载速度在3秒以内就可以称作合格了,加载速度越趋近于0,越快。 3秒定理

    2024年03月15日
    浏览(60)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包