Битва за железо: как российский бизнес выстраивает ИИ-инфраструктуру в условиях нехватки чипов

Еще пару лет назад компании спорили, стоит ли вкладываться в ИИ. Сегодня вопрос звучит иначе: «Где взять железо, чтобы этот ИИ заработал?». 

Мировая гонка за графическими процессорами превратила видеокарты в новый нефтяной ресурс — редкий, дорогой и стратегически важный. Россия оказалась в непростой ситуации: спрос растет, но поставки ограничены, а собственное производство все еще делом далекого будущего.

Почему рынок вычислительных мощностей «трещит по швам», как компании обходят ограничения и какие шаги помогут бизнесу не остаться без «топлива» для своих рабочих процессов — разберем в статье.

Еще пару лет назад компании спорили, стоит ли вкладываться в ИИ. Сегодня вопрос звучит иначе: «Где взять железо, чтобы этот ИИ заработал?».  Мировая гонка за графическими процессорами превратила видеокарты в новый нефтяной ресурс — редкий, дорогой и стратегически важный. Россия оказалась в непростой ситуации: спрос растет, но поставки ограничены, а собственное производство все еще делом далекого будущего. Почему рынок вычислительных мощностей «трещит по швам», как компании обходят ограничения и какие шаги помогут бизнесу не остаться без «топлива» для своих рабочих процессов — разберем в статье.

Чипы есть, доступа нет

Спрос на вычислительные ресурсы растет взрывными темпами: компании разворачивают ИИ-сервисы, обучают модели и автоматизируют процессы, но также сталкиваются с нехваткой базового ресурса — чипов. Речь идет о современных GPU уровня NVIDIA H100, B200 и B300 — «мозгах» для обучения крупных ИИ-моделей.

По данным исследований, глобальный рынок GPU оценивается в десятки миллиардов долларов: в одном из отчетов за 2024 год рынок графических процессоров-ускорителей для дата-центров составил примерно 87,3 млрд. долларов.

По прогнозам, он увеличится до 119,97 млрд. долларов к концу 2025 со среднегодовым ростом (CAGR) около 13,7% на период до 2030 года. В целом мировой рынок GPU, по оценкам аналитиков, был оценен на уровне 101,54 млрд. долларов в 2025 году, с прогнозом роста до более чем 1 млрд. долларов к 2034-му.

Для России же импорт критически важного ИТ-оборудования серьезно ограничен. По данным отчетов, после 2022 года около 65% ранее импортируемого ИКТ-аппаратного и программного обеспечения оказались под санкциями. При сверхрастущем спросе на мощные вычислительные платформы российский рынок оказывается в относительно худших условиях по сравнению с глобальным.

В таких условиях даже крупные игроки вынуждены искать обходные решения, чтобы не остановить развитие: 

«Общемировой дефицит во многом спровоцирован ажиотажным спросом на эти карты, в России же ситуация дополнительно осложняется ограничениями на поставки. Проблема частично решается за счет параллельного импорта, однако отсутствие прямого доступа к вендору — это не только сложности с поставками, но и недоступность официальных лицензий и инструментов, платформ и технологий». 

Алексей Зотов, руководитель направления ИТ-инфраструктуры К2Тех

А ключевая технология объединения GPU — Mellanox InfiniBand, также принадлежащая NVIDIA, фактически закрыта для отечественного рынка.

Дефицит чипов, как катализатор роста 

Дефицит чипов не парализовал российский ИТ-рынок — напротив, стал катализатором внутреннего роста. Компании, столкнувшись с невозможностью прямых поставок, начали искать другие пути: от параллельного импорта до разработки собственных решений и построения корпоративных дата-центров. На фоне глобального дефицита именно адаптивность и гибкость стали главным конкурентным преимуществом.

Одним из ключевых направлений стало развитие отечественных аппаратных платформ: 

«Российские производители уже предлагают готовые решения для корпоративного ИИ. В их числе — аппаратные платформы, например, от производителей Yadro, Delta Computers, FPlus или R-Style. Многие из них в последние год-два представили свои линейки серверов, в которые можно установить от 8 графических карт». 

Алексей Зотов, руководитель направления ИТ-инфраструктуры К2Тех

Параллельно набирают обороты программно-аппаратные комплексы под ключ, например, «К2 НейроТех» или «Скала-Р», которые объединяют безопасность, преднастроенные фреймворки и инструменты для MLOps. Такие системы позволяют компаниям развернуть полноценную ИИ-платформу за считанные дни, без необходимости погружаться в тонкости инфраструктуры. 

Все происходит автоматически: 

  • использование ресурсов фиксируется; 
  • стоимость рассчитывается в реальном времени; 
  • масштабирование под новые задачи бизнеса становится почти мгновенным.

Не остались в стороне и облачные провайдеры. В условиях дефицита «железа» они переходят на гибридные схемы и форматы GPU-as-a-Service, позволяющие компаниям арендовать вычислительные мощности по требованию. Компании могут больше не вкладываться в дорогое оборудование — они арендуют вычислительные мощности на время экспериментов и проектов, используют их только тогда, когда это действительно нужно. Такой подход превращает GPU из дефицитного ресурса в управляемый инструмент — гибкий и экономически эффективный.

Важна работа с инфраструктурой 

Важно понимать, что «железо» — лишь часть экосистемы. Не менее критичен вопрос инфраструктуры, в которой это железо работает. Октябрьский инцидент с пожаром в корейском дата-центре NIRS показал, что уязвимыми могут оказаться даже технологически продвинутые площадки. После этого случая во всем мире усилилось внимание к вопросам пожарной безопасности и отказоустойчивости ЦОД.

Пожарный обливает водой сгоревшие литий-ионные аккумуляторы, хранящиеся в резервуаре, после пожара в NIRS в Тэджоне, суббота 27 сентября // Источник: Yonhap
Пожарный обливает водой сгоревшие литий-ионные аккумуляторы, хранящиеся в резервуаре, после пожара в NIRS в Тэджоне, суббота 27 сентября // Источник: Yonhap

«Пожар в NIRS напомнил простую вещь: важны N+1/N+2 по всем узлам, геореплика, регулярные учения DR. В России ориентируемся на Tier III/IV, 152-ФЗ и 187-ФЗ, но зрелость по рынку разная», — отмечает Максим Захаренко, СЕО «Облакотека».

Кроме того, в России, по словам Дмитрия Бердникова, главного специалиста по пожарной безопасности STEP LOGIC, дата-центры изначально проектируются с учетом действующих строительных и противопожарных норм, хотя до недавнего времени эти требования были заимствованы из общепромышленных стандартов. 

«Законодательно кроме изменений в ФЗ “О связи”, это выразилось в утверждении новой редакции СП 541.1325800.2024 “Здания и сооружения центров обработки данных. Правила проектирования», а также появлении термина «центр обработки данных” в отдельных нормативных документах по пожарной безопасности». 

Дмитрий Бердников, главный специалист по пожарной безопасности STEP LOGIC

Особое внимание сегодня уделяется системам пожаротушения, включая газовые решения и технологии тонкораспыленной воды, а вопросы безопасности литиевых аккумуляторов только начинают активно прорабатываться.

Защита данных не ограничивается физической безопасностью — компании активно используют стратегию резервного копирования: 

«Существует золотое правило при формировании стратегии резервного копирования, которое называется “3-2-1” и означает, что нужно иметь как минимум три копии данных на двух разных типах носителей и одна копия должна храниться на территориально удаленной площадке. Вне зависимости от уровня надежности дата-центра, защита от подобных угроз должна быть реализована на уровне системы резервного копирования». 

Пресс-служба Selectel

Облачные сервисы позволяют реализовать этот принцип, но определить приоритеты и частоту копирования должен сам заказчик.

В целом российские дата-центры остаются достаточно защищенными: проекты проходят экспертизу, закладываются требования к резервированию и устойчивости, а компании вырабатывают собственные стандарты безопасности. Все это позволяет поддерживать стабильную работу инфраструктуры даже при высокой нагрузке и технологических ограничениях.

Российский чип: между амбицией и реальностью

Разговоры о создании российских GPU и серверных процессоров звучат все громче, но реальность остается куда жестче. ИЛИ Россия все активнее обсуждает возможность разработки собственных GPU и процессоров, однако пока это больше стратегическая цель, чем реальный проект. 

Разработка собственного «мозга» для ИИ — задача не только технологическая, но и стратегическая: она требует миллиардных инвестиций, десятилетий опыта и доступа к оборудованию, которого в стране попросту нет. Даже при растущем интересе государства и корпораций к импортонезависимости, разрыв с мировыми лидерами измеряется поколениями технологических циклов.

«Создать полноценное производство GPU и серверных чипов в России в ближайшие 10 лет крайне сложно в текущем технологическом контексте. Технологический разрыв очень велик: современные GPU (NVIDIA, AMD) и серверные CPU (Intel, AMD и т. д.) выпускаются на 5–3 нм. Для этого в первую очередь нужен экстремальный UV-литограф (EUV). Помимо оборудования, также необходимы материалы и специализированное программное обеспечение, плюс полноценная экосистема». 

Андрей Ильичев, руководитель департамента продуктовых решений «Инферит Техника» (ГК Softline)

Схожего мнения придерживается и Константин Хабаров, генеральный директор ООО «Байт». «Создание GPU или серверных SoC без доступа к современным технологическим процессам остается малореальным — максимум возможна разработка архитектур и прототипов под старые нормы. Опыта проектирования GPU в стране нет в принципе», — подчеркивает эксперт. 

EUV-литограф ASML // Источник: ixbt
EUV-литограф ASML // Источник: ixbt

Однако полное отставание — не приговор. В мире уже формируется ниша специализированных решений: энергоэффективных ASIC, ARM-платформ и RISC-V-процессоров для более конкретных и отраслевых задач. Именно здесь у России есть шанс закрепиться, если объединить усилия разработчиков, университетов (для подготовки и выпуска кадров) и частного капитала. 

Сейчас важно не догнать лидеров, а создать основу — подготовить кадры, развить инженерную школу и укрепить собственные компетенции в проектировании. Только пройдя этот путь, можно будет перейти от разговоров о «своем чипе» к его реальному производству.

Мировой расклад: как распределяются силы

Мировая же индустрия чипов сегодня напоминает сложный механизм, в котором каждая страна выполняет строго отведенную роль. Ни один игрок не контролирует всю цепочку от разработки до массового производства. США задают интеллектуальное направление, создают архитектуры, софт и инструменты проектирования. Тайвань и Южная Корея владеют одними из самых передовых производственных мощностей в мире. 

Китай же стремительно сокращает отставание, инвестируя миллиарды в развитие собственных архитектур, исследовательской базы, и формирует замкнутый технологический контур, независимый от Запада. 

При этом пока речь идет в основном о 28-нм решениях, и до передового уровня, по мнению Ильи Глейкина, ведущего бизнес-консультанта по развитию «ТМ АРБАЙТ», страна не дотягивает, поэтому баланс сил в обозримом будущем вряд ли изменится. 

Технологическое отставание Китая не означает полной изоляции от глобального рынка. Несмотря на то, что передовые узлы пока недоступны, страна активно осваивает средние и массовые сегменты, формирует собственные производственные возможности и нарабатывает опыт в проектировании GPU.

«Китайские производители быстро наращивают мощности, в том числе в сфере графических процессоров (GPU)… При этом китайские чипы становятся все более интересны и конкурентоспособны в среднем ценовом сегменте, в том числе для рынков, где доступ к западным технологиям ограничен».

Святослав Сорокин, директор по развитию бизнеса вычислительных систем STEP LOGIC

Для России это выбор между тем, чтобы остаться покупателем готовых решений, или тем, чтобы выстроить собственную нишу в этой глобальной архитектуре. Потенциальные локальные центры уже формируются по всей стране: 

«В России пока нет очевидного лидера, но формируются игроки. Например: «Микрон» (Зеленоград) — потенциал в аналоговой и legacy-логике, НИИ «Элвис», НПЦ «ЭЛВИС» — в RISC-V и embedded-решениях».

Андрей Ильичев, руководитель департамента продуктовых решений «Инферит Техника» (кластер «СФ Тех» ГК Softline)

Как действовать в условиях дефицита

Дефицит вычислительных мощностей заставляет бизнес не искать «запасные варианты», а выстраивать стратегию технологической устойчивости. Речь идет уже не о временных решениях, а о переосмыслении подхода к ИИ-инфраструктуре.

«Наша компания переживает дефицит следующим образом: это гибридные кластеры CPU+GPU, доля инференса на CPU/старших сетях, vGPU-шаринг, MPS/микрошардинг, квантование до INT8/FP8, аккуратный планировщик и preemption, FPGA — там, где дает выигрыш по ваттам».

Максим Захаренко, СЕО «Облакотека»

Компании комбинируют облака и локальные ресурсы, переходят на GPU-as-a-Service и оптимизируют собственные модели, чтобы снизить зависимость от дорогого «железа».

Свою эффективность уже доказали:

  • Гибридные облака — распределение задач между CPU и GPU, использование зарубежных площадок или мощностей, полученных через параллельный импорт.
  • GPU-as-a-Service — подключение мощных ускорителей тогда, когда они действительно нужны, без затрат на покупку и обслуживание оборудования.
  • Инвестиции в MLOps и оптимизацию моделей — чем эффективнее инфраструктура и код, тем меньше требуется вычислительных ресурсов.
  • Локальная адаптация — создание собственных микросервисов и работа с более доступными GPU, которые способны решать прикладные задачи без потери качества.

Чтобы не потерять темп в эпоху «железного дефицита», бизнесу важно действовать системно. Прежде всего, трезво оценить свои реальные потребности, так как не каждая ИИ-задача требует топовых GPU вроде H100, и зачастую разумнее использовать облачные мощности или оптимизированные модели. 

Параллельно стоит планировать технологическую независимость, следить за развитием отечественных решений и закладывать переход на них в долгосрочную стратегию.

Инвестиции в компетенции сегодня приносят не меньше пользы, чем вложения в оборудование: эффективная архитектура, отлаженный код и грамотная работа с MLOps позволяют экономить ресурсы без потери качества. 

И, наконец, важно выбирать партнеров, способных обеспечить устойчивость, тех, кто выстроил надежные каналы поставок и умеет работать с гибридными архитектурами, совмещая локальные и облачные ресурсы.

Что будем искать? Например,ChatGPT

Мы в социальных сетях