Что скрывается внутри GPU NVIDIA Blackwell Ultra?

Евгений

4 дня назад

Компания NVIDIA официально представила Blackwell Ultra — новую флагманскую модель, разработанную специально для тренировки и инференса ИИ-моделей следующего поколения. С акцентом на масштабируемость, энергоэффективность и плотную интеграцию, Blackwell Ultra станет основой будущих AI-фабрик.

Архитектура и производительность

Blackwell Ultra состоит из двух кристаллов, объединённых высокоскоростным интерфейсом NV-HBI. GPU основан на техпроцессе TSMC 4NP, содержит 208 миллиардов транзисторов и полностью совместим с экосистемой CUDA.

GPU NVIDIA Blackwell Ultra

Внутри — 160 потоковых мультипроцессоров (SM) с 640 тензорными ядрами нового поколения, обеспечивающими до 15 PFLOPS производительности в формате NVFP4 — это на 50% больше, чем у стандартного Blackwell, и в 7,5 раз выше, чем у H100/H200.

Потоковые мультипроцессоры (SM)

Тензорные ядра и формат NVFP4

Blackwell Ultra предлагает 5-е поколение Tensor Cores и второе поколение Transformer Engine, оптимизированное для работы с форматами FP8, FP6 и NVFP4. Новый 4-бит NVFP4 позволяет достигать точности, близкой к FP8.

Память и масштаб

Blackwell Ultra получил 288 Гбайт памяти HBM3E, что на 50% больше, чем у обычного Blackwell и в 3,6 раза больше, чем у H100. Пропускная способность — 8 Тбайт/с. Это позволяет размещать модели с 300+ миллиардами параметров без выгрузки данных из GPU.

NVIDIA Grace Blackwell Ultra Superchip

Интерфейсы и масштабируемость

GPU поддерживает NVLink 5 поколения, NVLink-C2C для связи с CPU Grace и PCIe Gen6. Всё это позволяет задействовать до 576 GPU в связке, создавая полноценные rack-scale AI-фабрики.

Безопасность и управление

GPU поддерживает TEE-I/O, аппаратную изоляцию задач (MIG), а также AI-мониторинг отказов (RAS Engine), обеспечивая отказоустойчивость и защищённость при работе с конфиденциальными данными.