NVIDIA Blackwell разгромила MLPerf Training 6.0: быстрее всех, крупнее всех, единственная во всех тестах
NVIDIA Blackwell стала абсолютным лидером MLPerf Training 6.0 — самого авторитетного отраслевого бенчмарка производительности обучения ИИ. Платформа показала лучшее время на каждом из семи тестов, включая два новых MoE-ворклоуда: DeepSeek-V3 671B и GPT-OSS-20B. При этом NVIDIA — единственный участник, представивший результаты по всем категориям.
Ключевые цифры: на DeepSeek-V3 671B (крупнейшая MoE-модель в наборе) NVIDIA масштабировала обучение до 8192 GPU на GB200 NVL72 — это самая масштабная Blackwell-инсталляция в истории MLPerf. На Llama 3.1 405B Microsoft Azure с GB200 NVL72 достигла эталонного качества за 7,07 минуты на 8192 GPU. CoreWeave на GB300 NVL72 с Spectrum-X Ethernet показал лучшее время на DeepSeek-V3 — 2,02 минуты на 8192 GPU.
GB300 NVL72 обеспечил до 1,6x прироста производительности по сравнению с GB200 NVL72 за счёт NVFP4, увеличенной памяти и более высокого энергопотребления. NVIDIA также продемонстрировала методы обучения в NVFP4, которые позволили предобучить 550-миллиардную модель Nemotron 3 Ultra с сохранением точности. В основе масштабирования — NVLink пятого поколения, объединяющий 72 GPU в единый вычислительный пул, и две сетевые платформы: Quantum InfiniBand и Spectrum-X Ethernet.