NVIDIA Blackwell架构革新,神经网络着色器引领潮流
时间:2025-01-16 11:11:00
Blackwell 堪称 NVIDIA 近年来在 GPU 架构上改动幅度最大的一次,开创性地引入神经网络着色器,为游戏开创了更为先进、快速且逼真的渲染方式。

Blackwell 架构的设计重点集中在四个方面:为全新神经网络运算进行优化、减少内存使用量、引入新型服务质量功能以及提升能源利用效率。

从核心层面来看,Ada 架构的 SM(Streaming Multiprocessor)内的着色核心(即 CUDA 核心),其中一半可依需求动态调整处理 FP32(单精度浮点数)和 INT32(32 位整数),另一半专门处理 FP32。
而 Blackwell SM 的着色核心则完全可依需求动态处理 FP32 和 INT32。

以往仅由着色核心处理着色工作负载的情况,如今在 Blackwell 架构中有所改变,通过神经网络着色方式,让该架构所拥有的第 5 代 Tensor 核心参与分担着色工作负载。

相较于 Ada 架构的着色器执行重新排序(Shader Execution Reordering, SER)主要针对光线追踪工作负载的重新排序,Blackwell 架构进一步针对神经网络着色工作负载进行排序。

将较为传统的着色工作分配给 CUDA 核心,需要运用神经网络运算的工作负载安排给 Tensor 核心,且两种核心能够同时运行,使整体效率提高至 2 倍。

第 5 代 Tensor 核心支持 FP4 精度模型的加速处理,相较于 Ada 架构第 4 代 Tensor 核心支持的 FP8 精度模型,其资料吞吐量可达 2 倍,相当于 Pascal 核心吞吐量的 32 倍,从而能够满足 DLSS 4 的多画格生成技术。

此外,相较于 Ada 架构的第 3 代光线追踪核心,Blackwell 架构的第 4 代光线追踪核心维持 Box Intersection Engine、Opacity Micromap Engine 等特性。


