OpenAI представила GPT-5.2 и заметно усилила работу с кодом и данными

Компьютерра 11 декабря 2025 22:54

На чтение: 2 минуты

Нравится:

OpenAI представила GPT-5.2 — новую линейку моделей, ориентированную на прикладную профессиональную работу: от кодовых ревью и анализа данных до подготовки презентаций и сложных рабочих документов. По результатам независимых тестов, модель показывает заметный прирост точности и устойчивости, а в ряде задач впервые выходит на уровень экспертов отрасли.

GPT-5.2 Thinking стала первой моделью OpenAI, которая в оценке GDPval — тесте, включающем реальные рабочие задания из 44 профессий — превзошла или сравнялась с экспертом в 70,9% случаев.

GDPval оценивает конкретные результаты работы модели: таблицы, планы, презентации, медицинские графики и производственные схемы. GPT-5.2 Thinking также выполняет эти задачи в более чем 11 раз быстрее, чем специалисты, при стоимости менее 1% от их часа работы — данные основаны на исторических метриках OpenAI.

В инженерных тестах GPT-5.2 показала наиболее заметный прирост:

SWE-bench Pro (публичная версия): 55,6% — выше, чем у GPT-5.1 (50,8%).
SWE-bench Verified: 80%, что сегодня является рекордом среди моделей OpenAI.

Этот тест требует применения патчей к реальным репозиториям на нескольких языках — то есть решает практические инженерные задачи, а не синтетические примеры. В математических и научных задачах также зафиксирован рост:

AIME 2025 — 100%, против 94% у GPT-5.1;
GPQA Diamond — 92,4% (было 88,1%);
ARC-AGI-1 — 86,2% и ARC-AGI-2 — 52,9%, где GPT-5.2 превосходит GPT-5.1 более чем вдвое.

Компании из экосистемы разработчиков уже отметили улучшения. JetBrains, Cognition, Warp, Augment Code и другие сообщили о повышении точности инструментального использования модели в кодовых ассистентах: проверка, генерация и поиск ошибок стали стабильнее. Платформы Databricks, Hex и Triple Whale подтвердили, что GPT-5.2 лучше справляется с агентными сценариями анализа данных и документов.

Отдельные улучшения заметны и в офисных задачах. Внутренние тесты OpenAI показали, что GPT-5.2 точнее формирует финансовые модели и презентации, чем GPT-5.1: корректнее выстраивает формулы, аккуратнее форматирует табличные блоки и лучше удерживает структуру длинного документа.

В ChatGPT пользователи платных планов получают доступ к GPT-5.2 Instant, Thinking и Pro начиная с сегодняшнего дня. В API все версии доступны разработчикам немедленно.

Подписывайтесь на наш Telegram Подписаться