据媒体报道,NVIDIA在近期的吹风会上,展示了Blackwell在数据中心的运行情况,并驳斥了此前关于Blackwell推迟上市的传闻。
不仅如此,NVIDIA NVLINK技术也迎来了重大升级,带宽翻倍达到1.4TB/s。
Blackwell平台不仅包含Blackwell GPU,还集成了Grace CPU、NVLINK Switch Chip、Bluefield-3、ConnectX-7、ConnectX-8、Spectrum-4和Quantum-3等多种芯片,形成了一个全面的数据中心解决方案。
Blackwell平台的设计目标是满足现代人工智能的需求,特别是针对超大型语言模型的计算需求,随着AI模型参数的不断增长,数据中心对计算能力和低延迟的要求也越来越高。
Blackwell平台的多GPU推理方法,通过在多个GPU上分配计算任务,实现了低延迟和高吞吐量的处理能力。
NVIDIA通过Blackwell推出了速度更快的NVLINK交换机,该交换机基于台积电4NP节点,提供了1.8TB/s的双向NVLINK带宽,能够连接72个GPU,大幅提高了数据中心的通信效率。
NVIDIA还分享了全球首张使用FP4计算生成的人工智能图像,展示了FP4量化模型在速度上的显著优势,同时保持了与FP16模型相似的图像质量。