OpenAI представила модель GPT-5.1-Codex-Max, превосходящую Google Gemini 3 Pro

OpenAI представила GPT-5.1-Codex-Max, новую модель искусственного интеллекта, созданную специально для решения задач программирования. Модель уже внедряется во все версии Codex для пользователей тарифов ChatGPT Plus, Pro, Edu и Enterprise, а выход в API запланирован на более поздний срок.

OpenAI представила модель GPT-5.1-Codex-Max, превосходящую Google Gemini 3 Pro

Релиз стал ответом компании на запуск Google Gemini 3 Pro. Согласно собственным оценкам OpenAI, новая модель вернула ей лидирующие позиции в нескольких ключевых бенчмарках для программирования. В SWE-Bench Verified, который считается одним из главных тестов для оценки способностей к программированию, GPT-5.1-Codex-Max демонстрирует результат в 78.5%, обходя показатели конкурентов: Google Gemini 3 Pro с результатом 76.2% и Claude Sonnet 4.5 с 77.2%. Рост производительности также наблюдается и по другим отраслевым бенчмаркам.

На стандартных настройках производительности — low, medium и high — модель показывает более высокие результаты, чем ее предшественница GPT-5.1-Codex, при этом потребляя значительно меньше токенов. Это означает, что она работает и быстрее, и экономичнее. Для задач, требующих максимальной точности, был добавлен новый режим — «xhigh». В OpenAI также отмечают, что в ходе внутренних испытаний модель успешно работала над одной задачей до 24 часов подряд без какого-либо вмешательства со стороны человека.

Новая модель нативно обучена работе с несколькими контекстными окнами с помощью механизма compaction. Это означает, что модель самостоятельно анализирует и «уплотняет» историю диалога, вычленяя наиболее важную информацию и используя ее для продолжения работы. Данная технология позволяет модели последовательно обрабатывать миллионы токенов в рамках единой сложной задачи, такой как рефакторинг крупного проекта или многоэтапная отладка.

Повышение эффективности работы модели может привести к снижению затрат при выполнении задач программирования. В частности, отмечается возможность создания качественных интерфейсов с меньшим потреблением ресурсов по сравнению с предыдущими версиями.

Что будем искать? Например,ChatGPT

Мы в социальных сетях