NVIDIA анонсировала Nemotron 3 — семейство открытых моделей, библиотек и наборов данных, разработанных для создания масштабируемых и эффективных агентных ИИ-систем. Новые модели позволяют разрабатывать многоагентные решения с высокой точностью и низкой стоимостью инференса, сохраняя открытость и контроль над данными.
Nemotron 3 предлагает три модели:
- Nano — компактная модель с 30 миллиардами параметров. Подходит для задач программирования, суммаризации текста, работы AI-ассистентов и поиска информации.
- Super — высокоточная модель с примерно 100 миллиардами параметров. Предназначена для работы нескольких агентов в сложных сценариях.
- Ultra — крупная модель с 500 миллиардами параметров. Необходима для сложных вычислительных и стратегических AI-задач.
Новые модели используют гибридную архитектуру MoE, которая повышает эффективность обработки токенов до 4 раз по сравнению с Nemotron 2 Nano.
Ранние пользователи, включая Accenture, Deloitte, ServiceNow, Siemens, Zoom и Palantir, уже интегрируют Nemotron 3 для автоматизации процессов в производстве, кибербезопасности, разработке ПО и других сферах.
Модели Nemotron 3 Nano уже доступны на платформе Hugging Face и через сервисы инференса, включая Baseten, Fireworks, OpenRouter и другие. Super и Ultra выйдут в первой половине 2026 года.
