详解智能座舱芯片算力评估_汽车技术_

4. 其他评估参数

正如从 GFLOPS 的定义以及 GPU 架构原理中看到的那样，GFLOPS 虽然是计算能力的理论值，但并不能全面反映顶点处理、几何处理以及像素处理的能力。GPU 的实际性能会受到多种因素的影响，包括不同的 GPU 架构、驱动程序、应用程序以及显存等。

此外，还有其他一些评估参数也可用于评估 GPU 的性能。

1 ）帧率：帧率是指 GPU 在处理图形渲染任务时，每秒能够输出的图像帧数。测试结果显示，较高的帧率表示 GPU 能够更快地渲染图像，提供更流畅的视觉体验。

2）像素填充率（Pixel Fill Rate）：像素填充率是指 GPU 每秒能够渲染的像素数量。它与 GPU 的核心数、频率和内存带宽等因素相关。测试结果显示，较高的像素填充率表示 GPU 能够更快地渲染图像。

它可以通过以下公式来计算：

其中，每个周期的像素输出数取决于 GPU 的 ROP（渲染输出端口）的数量和每个 ROP 的吞吐量。时钟周期数是指 GPU 的时钟频率，即每秒包含的时钟周期数。

3 ）纹理填充率（Texture Fill Rate）：纹理填充率是指 GPU 每秒能够处理的纹理像素数量。纹理是应用于物体表面的图像，较高的纹理填充率表示 GPU 能够更快地处理纹理映射，提供更细腻的图像。

4）像素着色器性能：像素着色器是 GPU 中负责对每个像素进行颜色计算的部分。像素着色器性能与 GPU 的核心数、频率和架构等因素相关。较高的像素着色器性能表示 GPU 能够更快地进行像素级别的计算，提供更复杂的图像效果。

5）渲染分辨率：渲染分辨率是指 GPU 能够支持的最大图像分辨率。较高的渲染分辨率表示 GPU 能够处理更大尺寸的图像，提供更好的图像细节和清晰度。

6）帧缓冲带宽：帧缓冲带宽是指 GPU 与帧缓冲区之间的数据传输速度。帧缓冲区是存储渲染结果的内存区域，较高的帧缓冲带宽可以提高数据传输效率，加快渲染速度。

4. 基准测试程序

正如在 CPU 的性能基准测试中使用 SPEC CPU2017 一样，GPU 也有相关的基准测试程序。

（ 1 ）3D Mark 测试

3DMark 由 Futuremark 公司开发的，用于测试计算机、移动设备和智能手机等设备的图形性能和稳定性。其测试结果可以反映设备性能的高低以及是否能够运行要求高的 3D 游戏。

3DMark 的测试包括多项测试，如 CPU、GPU、物理特性、帧数等，可以帮助用户在不同设备之间进行比较，为用户选择设备提供参考。其测试基于 DirectX 、OpenGL 和 Vulkan 等图形 API 实现，模拟了现代 3D 游戏和应用程序中的复杂渲染效果。

目前主流的 3DMark 版本是 3DMark FireStrike，它包括了火焰测试段（Graphicstest）、物理计算测试段（Physicstest）和组合测试段（Combinedtest）三种测试模式。它可以适应绝大多数游戏的要求，能够对显卡的 3D 性能、CPU 的物理性能以及整机的综合性能进行测试评估。

此外，3DMark还可以评估GPU在VR 环境中的性能表现。测试基于 OpenVR API 实现，模拟了虚拟现实中的渲染和交互效果。

图4 是使用 3DMark 对智能手机 SoC 中的 GPU 进行测评的评分。

图 4 多款 GPU 的 3D Mark 基准测试结果

3D Mark 测试程序主要使用了 2 种访问 GPU 的应用程序接口进行测试，一种是 OpenGL ES，另一种是 Vulkan。

从跑分结果来看，麒麟 9000 芯片使用的 Mali-G78C24（24 核心）的分值最高。其中 Mali 系列 GPU 是由ARM 公司发布的 IP 核（知识产权核）设计，SoC 厂商可以将其集成到自己的产品中来。

OpenGL ES 是 OpenGL（三维图形应用程序）接口的子集，为手机、个人掌上数字助理和游戏主机等嵌入式设备而设计。它去除了许多不必要的特性，并增加了一些适合嵌入式系统使用的特性。OpenGL ES 比 OpenGL 更为轻量级、高效，更适合在移动设备上运行。

Vulkan 是 Khronos Group 推出的新一代图形处理应用程序接口，旨在提供更高效的图形渲染和计算能力，特别适合移动设备。Vulkan 的设计目标是减少驱动程序的开销，并提供更直接的硬件访问能力，以提高性能和效率。

（2）曼哈顿测试

曼哈顿测试是3D图像测试中常用的基准测试软件，它是 GFXbench 的一部分。GFXbench是一款跨平台的3D基准测试软件，可精准反映设备 GPU 的图形性能。它有多种测试场景，可以充分考察设备的 OpenGL ES 的表现，并且可以进行电池续航测试。

GFXBench 的测试项目包括霸王龙（T-Rex）、曼哈顿 3.0（Manhattan）、曼哈顿 3.1、赛车（Car Chase）等。这些测试项目分别对应 OpenGL ES 2.0/3.0/3.1/3.1 标准下的性能。每个测试都会生成一个平均帧率（FPS），用以衡量测试结果的好坏。

另外，GFXbench 还提供了当屏（OnScreen）和离屏（OffScreen）两种测试。当屏即以设备屏幕原生分辨率运行测试，离屏则将分辨率统一到 1080P ，便于跨设备对比。

例如，在曼哈顿 3.0 测试中，骁龙888的GPU 达到了175帧/ 秒，而骁龙7 Gen1的GPU达到了90帧/ 秒。在功耗方面，骁龙888的功耗为8.34W，而骁龙7Gen1的功耗为5.91W。这些数据可以作为对比不同GPU性能的依据。

（3 ）安兔兔测试（*现代智能座舱主要参考手机芯片重新设计，所以安兔兔测试也适用）

安兔兔测试是通过运行一系列特定的测试程序来对智能手机的 GPU 性能进行测试，根据测试结果给出一个总分。这些测试程序模拟了现实生活中的各种应用场景，如游戏、视频播放、网页浏览等，以评估 GPU 在处理这些任务时的性能表现。

具体来说，安兔兔测试会对 GPU 的渲染能力、计算能力、图像处理能力等方面进行测试。在渲染能力方面，测试程序会模拟复杂的 3D 场景，以评估 GPU 的渲染速度和效果；在计算能力方面，测试程序会进行大量的数学运算，以评估 GPU 的计算速度和精度；在图像处理能力方面，测试程序会模拟各种图像处理任务，如降噪、锐化等，以评估 GPU 的图像处理能力。

（4）游戏测试

除了基准测试程序之外，采用实际的应用程序对 GPU 性能进行评测是一种常见方法。在智能座舱 SoC 越来越向消费类电子性能靠近的时代，使用流行的游戏对 GPU 性能进行测试可以预测用户的直观感受。

目前智能手机上常使用的评测游戏有《原神》《王者荣耀》等。

#04NPU 算力评估

在智能座舱的应用中，专用的 AI 推理组件在座舱 SoC 中是不可或缺的。通常情况下，为了进行人工智能相关的模型运算，需要在座舱 SoC 中集成 NPU。

4.1 NPU 架构原理

在座舱内部的感知算法中，针对 NLP 主要运用 RNN（循环神经网络）或 LSTM（长短时记忆网络）。这些网络能处理诸如语音信号等序列数据，学习其特征和模式，并通过大量文本数据训练来提升机器理解和生成人类语言的能力。图像识别则主要采用 CNN ，CNN 通过卷积运算精准提取图像特征，实现对象的有效识别和分类。

在选择座舱 SoC中的NPU时，必须确保其能支持RNN和CNN模型。RNN模型的节点以环状方式定向连接，具备出色的记忆能力，非常适合处理任意时序的输入数据。作为专门处理二维数据的多层神经网络，CNN不仅具备出色的容错、并行处理和自学习能力，广泛应用于模式分类、物体检测与识别等领域。因此，对这两种模型的支持情况是选择NPU的重要考量因素。

1. NPU 计算原理

顾名思义，CNN 和 RNN 都属于神经网络模型，它们通常采用神经元来进行计算。神经元是神经网络中的基本单元，它接收多个输入信号，通过一定的计算产生输出信号，并将输出信号传递给其他神经元。神经元的组成公式可以表示为：

来源：汽车电子与软件

作者：张慧敏