На рынке нейросетей лидерство традиционно удерживает компания OpenAI. С момента выпуска публичной версии ChatGPT компания стабильно предлагает инновационные решения: доступ в интернет, сторонние плагины, работу с документами и изображениями прямо в чате, расширенные контекстные окна. А в конце 2024 года OpenAI представила модель o1, а позже и o3, способную размышлять и решать сложные задачи. Это стало значительным шагом в направлении AGI (общего искусственного интеллекта), который способен выполнять широкий спектр задач лучше человека.
Однако использование технологий OpenAI в России остается проблематичным. OpenAI официально недоступна в стране, оплатить ее услуги невозможно, а боты-посредники часто ограничивают функционал. Но 20 января 2025 года ситуация кардинально изменилась. DeepSeek-AI (深度求索), китайская компания, специализирующаяся на больших языковых моделях (LLM) и передовых AI-технологиях, представила революционную модель DeepSeek-R1.
Модель выделяется выдающимися способностями к логическому мышлению, математическим вычислениям и программированию. Производительность DeepSeek-R1 сравнима с OpenAI o1-1217, устанавливая новый стандарт для открытых AI-решений.
DeepSeek-R1, обученная исключительно методом обучения с подкреплением (RL), демонстрирует впечатляющие результаты:
- AIME 2024: 71% точности (86,7% с методом majority voting);
- MATH-500: 97,3%;
- Codeforces: 96,3% процентиль;
- MMLU: 90,8%.
«Эти результаты ставят ее в один ряд с лучшими моделями OpenAI. Я сравнил модель OpenAI o1 и DeepSeek-R1 на решении последней задачи с демо-версии ЕГЭ 2024 года по профильной математике. Обе модели справились, однако DeepSeek потребовалось 138 секунд, тогда как OpenAI o1 справилась за 8 минут и 22 секунды. Решение задачи скрыто в рассуждениях».
Кирилл Пшинник, генеральный директор онлайн-университета «Зероводер»
По мнению эксперта, ключевым преимуществом DeepSeek-R1 является ее доступность:
- Исходные коды, веса моделей и инструкции находятся в открытом доступе на официальном сайте DeepSeek-AI.
- Компания приглашает разработчиков к совместной работе над улучшением технологии, что позволяет развёртывать модель локально в безопасной инфраструктуре — критически важно для российских корпораций.
- Модель доступна в шести дистиллированных версиях (1,5B, 7B, 8B, 14B, 32B, 70B), основанных на архитектурах Qwen и Llama, которые можно запускать на локальных компьютерах. Даже компактная версия DeepSeek-R1-7B превосходит GPT-4o в математических задачах.
- Модель доступна в России. Для личного использования модель предоставляется бесплатно через сайтchat.deepseek.com. API для интеграции в сервисы стоит в шесть раз дешевле, чем у OpenAI.
Кроме того, DeepSeek-R1 умеет искать информацию в интернете и анализировать найденные материалы. В отличие от конкурентов, она обрабатывает больше данных за меньшее время, что делает ее незаменимой для аналитиков и исследователей.
«Выход DeepSeek-R1 открывает новую эру в мире искусственного интеллекта. Эта модель не только демонстрирует передовые технологические достижения, но и меняет правила игры для пользователей, особенно в регионах с ограниченным доступом к зарубежным сервисам, таких как Россия или Китай. Бесплатное использование, локальное развертывание и невероятная производительность делают её идеальным инструментом для бизнеса и научных исследований», — делится Пшинник.
Так, DeepSeek-R1 показывает, что инновации могут быть доступными и демократичными. Это не просто конкурент OpenAI — это новый этап в эволюции искусственного интеллекта, который уже сейчас приносит ощутимую пользу пользователям по всему миру.