Потребление генеративных нейросетей в облаке за 2025 год выросло в пять раз

Корпорация Yandex B2B Tech подвела первые итоги работы платформы для разработки ИИ-приложений Yandex AI Studio. С начала 2025 года ежедневное потребление вычислительных ресурсов нейросетей в облачной инфраструктуре выросло более чем в пять раз.

Потребление генеративных нейросетей в облаке за 2025 год выросло в пять раз

По состоянию на сентябрь годовая прогнозируемая выручка от облачного потребления услуг платформы превысила 1,2 миллиарда рублей. Рост интереса к генеративным моделям объясняется увеличением числа реальных сценариев их применения с ощутимым бизнес-эффектом. Создание и внедрение ИИ-ассистентов и других решений на базе искусственного интеллекта стало возможным с помощью специализированных инструментов.

На платформе Yandex AI Studio доступно более двадцати развернутых в облаке моделей. Наиболее востребованными остаются модели семейства YandexGPT, на которые приходится 62,7% общего трафика. Высокий спрос позволил компании снизить цены на собственные модели. Следующими по популярности являются открытые модели Qwen3-235b от Alibaba Group и GPT-OSS от OpenAI.

Модели YandexGPT чаще всего применяются для RAG-сценариев, включая поиск информации и генерацию ответов на основе документов, таблиц и изображений, а также для пересказа больших объемов информации. Модель Qwen3-235b часто используется для создания агентских систем, способных работать с внешними приложениями, и для написания кода по запросу. Количество пользователей платформы Yandex AI Studio к сентябрю достигло 40 тысяч клиентов, почти половину из которых составляет крупный бизнес.

По словам руководителя платформы Артура Самигуллина, компания активно инвестирует в развитие облачного ML-рынка в России. Помимо нейросетей, платформа предлагает RAG-инструменты для поиска по интернету, документам и базам знаний, а также возможность создания текстовых и голосовых ИИ-агентов без программирования. Компании также могут использовать модели и инструменты Yandex AI Studio на собственной инфраструктуре, в том числе с помощью решения Yandex Cloud Stackland для ускоренного развертывания.

Что будем искать? Например,ChatGPT

Мы в социальных сетях