分享好友 资讯首页 频道列表

详解智能座舱芯片算力评估

2024-12-31 17:20

4. 其他评估参数

正如从 GFLOPS 的定义以及 GPU 架构原理中看到的那样,GFLOPS 虽然是计算能力的理论值,但并不能全面反映顶点处理、几何处理以及像素处理的能力。GPU 的实际性能会受到多种因素的影响,包括不同的 GPU 架构、驱动程序、应用程序以及显存等。

此外,还有其他一些评估参数也可用于评估 GPU 的性能。

1 )帧率:帧率是指 GPU 在处理图形渲染任务时,每秒能够输出的图像帧数。测试结果显示,较高的帧率表示 GPU 能够更快地渲染图像,提供更流畅的视觉体验。

2)像素填充率(Pixel Fill Rate):像素填充率是指 GPU 每秒能够渲染的像素数量。它与 GPU 的核心数、频率和内存带宽等因素相关。测试结果显示,较高的像素填充率表示 GPU 能够更快地渲染图像。

它可以通过以下公式来计算:

图片

其中,每个周期的像素输出数取决于 GPU 的 ROP(渲染输出端口)的数量和每个 ROP 的吞吐量。时钟周期数是指 GPU 的时钟频率,即每秒包含的时钟周期数。

3 )纹理填充率(Texture Fill Rate):纹理填充率是指 GPU 每秒能够处理的纹理像素数量。纹理是应用于物体表面的图像,较高的纹理填充率表示 GPU 能够更快地处理纹理映射,提供更细腻的图像。

4)像素着色器性能:像素着色器是 GPU 中负责对每个像素进行颜色计算的部分。像素着色器性能与 GPU 的核心数、频率和架构等因素相关。较高的像素着色器性能表示 GPU 能够更快地进行像素级别的计算,提供更复杂的图像效果。

5)渲染分辨率:渲染分辨率是指 GPU 能够支持的最大图像分辨率。较高的渲染分辨率表示 GPU 能够处理更大尺寸的图像,提供更好的图像细节和清晰度。

6)帧缓冲带宽:帧缓冲带宽是指 GPU 与帧缓冲区之间的数据传输速度。帧缓冲区是存储渲染结果的内存区域,较高的帧缓冲带宽可以提高数据传输效率,加快渲染速度。

4. 基准测试程序

正如在 CPU 的性能基准测试中使用 SPEC CPU2017 一样,GPU 也有相关的基准测试程序。

( 1 )3D Mark 测试

3DMark 由 Futuremark 公司开发的,用于测试计算机、移动设备和智能手机等设备的图形性能和稳定性。其测试结果可以反映设备性能的高低以及是否能够运行要求高的 3D 游戏。

3DMark 的测试包括多项测试,如 CPU、GPU、物理特性、帧数等,可以帮助用户在不同设备之间进行比较,为用户选择设备提供参考。其测试基于 DirectX 、OpenGL 和 Vulkan 等图形 API 实现,模拟了现代 3D 游戏和应用程序中的复杂渲染效果。

目前主流的 3DMark 版本是 3DMark FireStrike,它包括了火焰测试段(Graphicstest)、物理计算测试段(Physicstest)和组合测试段(Combinedtest)三种测试模式。它可以适应绝大多数游戏的要求,能够对显卡的 3D 性能、CPU 的物理性能以及整机的综合性能进行测试评估。

此外,3DMark还可以评估GPU在VR 环境中的性能表现。测试基于 OpenVR API 实现,模拟了虚拟现实中的渲染和交互效果。

图4 是使用 3DMark 对智能手机 SoC 中的 GPU 进行测评的评分。

图片

图 4  多款 GPU 的 3D Mark 基准测试结果

3D Mark 测试程序主要使用了 2 种访问 GPU 的应用程序接口进行测试,一种是 OpenGL ES,另一种是 Vulkan。

从跑分结果来看,麒麟 9000 芯片使用的 Mali-G78C24(24 核心)的分值最高。其中 Mali 系列 GPU 是由ARM 公司发布的 IP 核(知识产权核)设计,SoC 厂商可以将其集成到自己的产品中来。

OpenGL ES 是 OpenGL(三维图形应用程序)接口的子集,为手机、个人掌上数字助理和游戏主机等嵌入式设备而设计。它去除了许多不必要的特性,并增加了一些适合嵌入式系统 使用的特性。OpenGL ES 比 OpenGL 更为轻量级、高效,更适合在移动设备上运行。

Vulkan 是 Khronos Group 推出的新一代图形处理应用程序接口,旨在提供更高效的图形渲染和计算能力,特别适合移动设备。Vulkan 的设计目标是减少驱动程序的开销,并提供更直接的硬件访问能力,以提高性能和效率。

(2)曼哈顿测试

曼哈顿测试是3D图像测试中常用的基准测试软件,它是 GFXbench 的一部分。GFXbench是一款跨平台的3D基准测试软件,可精准反映设备 GPU 的图形性能。它有多种测试场景,可以充分考察设备的 OpenGL ES 的表现,并且可以进行电池续航测试。

GFXBench 的测试项目包括霸王龙(T-Rex)、曼哈顿 3.0(Manhattan)、曼哈顿 3.1、赛车(Car Chase)等。这些测试项目分别对应 OpenGL ES 2.0/3.0/3.1/3.1 标准下的性能。每个测试都会生成一个平均帧率(FPS),用以衡量测试结果的好坏。

另外,GFXbench 还提供了当屏(OnScreen)和离屏(OffScreen)两种测试。当屏即以设备屏幕原生分辨率运行测试,离屏则将分辨率统一到 1080P ,便于跨设备对比。

例如,在曼哈顿 3.0 测试中,骁龙888的GPU 达到了175帧/ 秒,而骁龙7  Gen1的GPU达到了90帧/ 秒。在功耗方面,骁龙888的功耗为8.34W,而骁龙7Gen1的功耗为5.91W。这些数据可以作为对比不同GPU性能的依据。

(3 )安兔兔测试(*现代智能座舱主要参考手机芯片重新设计,所以安兔兔测试也适用)

安兔兔测试是通过运行一系列特定的测试程序来对智能手机的 GPU 性能进行测试,根据测试结果给出一个总分。这些测试程序模拟了现实生活中的各种应用场景,如游戏、视频播 放、网页浏览等,以评估 GPU 在处理这些任务时的性能表现。

具体来说,安兔兔测试会对 GPU 的渲染能力、计算能力、图像处理能力等方面进行测试。在渲染能力方面,测试程序会模拟复杂的 3D 场景,以评估 GPU 的渲染速度和效果;在计算能力方面,测试程序会进行大量的数学运算,以评估 GPU 的计算速度和精度;在图像处理能力方面,测试程序会模拟各种图像处理任务,如降噪、锐化等,以评估 GPU 的图像处理能力。

(4)游戏测试

除了基准测试程序之外,采用实际的应用程序对 GPU 性能进行评测是一种常见方法。在 智能座舱 SoC 越来越向消费类电子性能靠近的时代,使用流行的游戏对 GPU 性能进行测试可以预测用户的直观感受。

目前智能手机上常使用的评测游戏有《原神》《王者荣耀》等。

#04NPU 算力评估


在智能座舱的应用中,专用的 AI 推理组件在座舱 SoC 中是不可或缺的。通常情况下,为 了进行人工智能相关的模型运算,需要在座舱 SoC 中集成 NPU。

4.1 NPU 架构原理

在座舱内部的感知算法中,针对 NLP 主要运用 RNN(循环神经网络)或 LSTM(长短时记忆网络)。这些网络能处理诸如语音信号等序列数据,学习其特征和模式,并通过大量文本数据训练来提升机器理解和生成人类语言的能力。图像识别则主要采用 CNN ,CNN 通过卷积运算精准提取图像特征,实现对象的有效识别和分类。

在选择座舱 SoC中的NPU时,必须确保其能支持RNN和CNN模型。RNN模型的节点以环状方式定向连接,具备出色的记忆能力,非常适合处理任意时序的输入数据。作为专门处理二维数据的多层神经网络,CNN不仅具备出色的容错、并行处理和自学习能力,广泛应用于模式分类、物体检测与识别等领域。因此,对这两种模型的支持情况是选择NPU的重要考量因素。

1. NPU 计算原理

顾名思义,CNN 和 RNN 都属于神经网络模型,它们通常采用神经元来进行计算。神经元是神经网络中的基本单元,它接收多个输入信号,通过一定的计算产生输出信号,并将输出信号传递给其他神经元。神经元的组成公式可以表示为:

图片

来源:汽车电子与软件

作者:张慧敏

« 上一页 4/7 下一页 »
评论 0
同类信息