OpenAI представляет o3 и o4-mini — умные модели с расширенными возможностями

Компания OpenAI анонсировала две новые модели — o3 и o4-mini, которые умеют глубже анализировать запросы, эффективно использовать все инструменты платформы. Модели самостоятельно определяют, когда применять поиск в интернете, анализ данных или генерацию изображений.

OpenAI представляет новые модели o3 и o4-mini — самые интеллектуальные на сегодняшний день. Они способны анализировать запросы, эффективно использовать все инструменты ChatGPT, включая поиск в интернете, анализ файлов, визуальных данных и генерацию изображений, а также применять Python для сложных вычислений. Эти модели самостоятельно определяют, когда и какие инструменты использовать, чтобы давать точные и продуманные ответы за минуту или меньше, что делает их мощным решением для сложных задач.

OpenAI o3 — флагманская модель с передовыми возможностями в программировании, математике, науке и анализе изображений. Она устанавливает новые рекорды в тестах Codeforces, SWE-bench и MMMU, демонстрируя на 20% меньше ошибок, чем o1, особенно в программировании, бизнес-анализе и творческих задачах. Модель отлично справляется с генерацией и проверкой гипотез в биологии, инженерии и других науках.

OpenAI o4-mini — компактная и экономичная версия, оптимизированная для быстрых вычислений. Она превосходит предыдущие модели в математике, программировании и визуальных задачах, а также эффективна в науке о данных. Благодаря высокой скорости и низкой стоимости o4-mini поддерживает большие объемы запросов, оставаясь мощным инструментом для повседневного использования.

Обе модели стали более естественными в общении, учитывают контекст предыдущих диалогов и чаще ссылаются на достоверные источники. Их обучили не только пользоваться инструментами, но и выбирать оптимальные способы решения задач.

Безопасность — ключевой приоритет. Для o3 и o4-mini переработаны данные обучения, усилена защита от биорисков, вредоносного ПО и джейлбрейков. Внутренние тесты показывают высокую устойчивость к опасным запросам. Дополнительный монитор на базе LLM, обученный на человеческих спецификациях, выявляет 99% рисков, что делает модели надежными в использовании.

Что будем искать? Например,ChatGPT

Мы в социальных сетях