Компания NVIDIA официально представила Blackwell Ultra — новую флагманскую модель, разработанную специально для тренировки и инференса ИИ-моделей следующего поколения. С акцентом на масштабируемость, энергоэффективность и плотную интеграцию, Blackwell Ultra станет основой будущих AI-фабрик.
Архитектура и производительность
Blackwell Ultra состоит из двух кристаллов, объединённых высокоскоростным интерфейсом NV-HBI. GPU основан на техпроцессе TSMC 4NP, содержит 208 миллиардов транзисторов и полностью совместим с экосистемой CUDA.
Внутри — 160 потоковых мультипроцессоров (SM) с 640 тензорными ядрами нового поколения, обеспечивающими до 15 PFLOPS производительности в формате NVFP4 — это на 50% больше, чем у стандартного Blackwell, и в 7,5 раз выше, чем у H100/H200.
Тензорные ядра и формат NVFP4
Blackwell Ultra предлагает 5-е поколение Tensor Cores и второе поколение Transformer Engine, оптимизированное для работы с форматами FP8, FP6 и NVFP4. Новый 4-бит NVFP4 позволяет достигать точности, близкой к FP8.
Память и масштаб
Blackwell Ultra получил 288 Гбайт памяти HBM3E, что на 50% больше, чем у обычного Blackwell и в 3,6 раза больше, чем у H100. Пропускная способность — 8 Тбайт/с. Это позволяет размещать модели с 300+ миллиардами параметров без выгрузки данных из GPU.
Интерфейсы и масштабируемость
GPU поддерживает NVLink 5 поколения, NVLink-C2C для связи с CPU Grace и PCIe Gen6. Всё это позволяет задействовать до 576 GPU в связке, создавая полноценные rack-scale AI-фабрики.
Безопасность и управление
GPU поддерживает TEE-I/O, аппаратную изоляцию задач (MIG), а также AI-мониторинг отказов (RAS Engine), обеспечивая отказоустойчивость и защищённость при работе с конфиденциальными данными.