Nvidia представила новое поколение агентных моделей Nemotron 3

Компания Nvidia представила новое поколение ИИ-моделей Nemotron 3 в трех версиях: Nano, Super и Ultra. Архитектура на основе микшера экспертов (MoE) обеспечивает рост производительности и снижение затрат на генерацию.

Nvidia представила новое поколение агентных моделей Nemotron 3

Компания Nvidia представила новое поколение агентных моделей Nemotron 3. Линейка включает три основные версии, различающиеся по масштабу и назначению. Базовая модель Nemotron 3 Nano содержит 30 миллиардов параметров и ориентирована на узкоспециализированные и скоростные задачи. Модель Nemotron 3 Super, с 100 миллиардами параметров, предназначена для сложных мультиагентных сценариев, требующих высокоточного рассуждения. Флагманская версия Nemotron 3 Ultra обладает приблизительно 500 миллиардами параметров и мощным движком рассуждений для решения наиболее сложных задач.

При разработке Nemotron 3 использована гибридная архитектура микшера экспертов, что, по заявлению компании, повышает масштабируемость и эффективность моделей. Архитектура, в сочетании с контекстным окном в один миллион токенов, призвана предоставить разработчикам широкие возможности для кастомизации специализированного искусственного интеллекта. В версиях Super и Ultra применяется новая архитектура latent MoE.

По данным Nvidia, новая линейка демонстрирует увеличение пропускной способности по токенам до четырех раз по сравнению с предшествующей моделью Nemotron 2 Nano. Кроме того, за счет оптимизации генерации токенов рассуждения удалось снизить стоимость генерации. Более крупные модели, Super и Ultra, обучались с использованием 4-битного формата NVFP4, что позволяет проводить их тренировку на существующей инфраструктуре без потери точности.

Разработчикам уже доступна младшая версия Nano. Более мощные решения появятся в следующем году: модель среднего уровня Super выйдет в первом квартале 2026 года, а флагманская Ultra станет доступна в первой половине 2026 года. Такая стратегия позволяет Nvidia планомерно интегрировать свои инструменты в рабочие процессы.

Что будем искать? Например,ChatGPT

Мы в социальных сетях