NVIDIA Blackwell架构革新，神经网络着色器引领潮流

时间：2025-01-16 11:11:00

Blackwell 堪称 NVIDIA 近年来在 GPU 架构上改动幅度最大的一次，开创性地引入神经网络着色器，为游戏开创了更为先进、快速且逼真的渲染方式。

NVIDIA Blackwell架构革新，神经网络着色器引领潮流宣传图1

Blackwell 架构的设计重点集中在四个方面：为全新神经网络运算进行优化、减少内存使用量、引入新型服务质量功能以及提升能源利用效率。

NVIDIA Blackwell架构革新，神经网络着色器引领潮流宣传图2

从核心层面来看，Ada 架构的 SM（Streaming Multiprocessor）内的着色核心（即 CUDA 核心），其中一半可依需求动态调整处理 FP32（单精度浮点数）和 INT32（32 位整数），另一半专门处理 FP32。

而 Blackwell SM 的着色核心则完全可依需求动态处理 FP32 和 INT32。

NVIDIA Blackwell架构革新，神经网络着色器引领潮流宣传图3

以往仅由着色核心处理着色工作负载的情况，如今在 Blackwell 架构中有所改变，通过神经网络着色方式，让该架构所拥有的第 5 代 Tensor 核心参与分担着色工作负载。

NVIDIA Blackwell架构革新，神经网络着色器引领潮流宣传图4

相较于 Ada 架构的着色器执行重新排序（Shader Execution Reordering, SER）主要针对光线追踪工作负载的重新排序，Blackwell 架构进一步针对神经网络着色工作负载进行排序。

NVIDIA Blackwell架构革新，神经网络着色器引领潮流宣传图5

将较为传统的着色工作分配给 CUDA 核心，需要运用神经网络运算的工作负载安排给 Tensor 核心，且两种核心能够同时运行，使整体效率提高至 2 倍。

NVIDIA Blackwell架构革新，神经网络着色器引领潮流宣传图6

第 5 代 Tensor 核心支持 FP4 精度模型的加速处理，相较于 Ada 架构第 4 代 Tensor 核心支持的 FP8 精度模型，其资料吞吐量可达 2 倍，相当于 Pascal 核心吞吐量的 32 倍，从而能够满足 DLSS 4 的多画格生成技术。

NVIDIA Blackwell架构革新，神经网络着色器引领潮流宣传图7

此外，相较于 Ada 架构的第 3 代光线追踪核心，Blackwell 架构的第 4 代光线追踪核心维持 Box Intersection Engine、Opacity Micromap Engine 等特性。

谭懿可
发布作者