В условиях цифровой трансформации ИТ-инфраструктура является фундаментом, без которого не может работать ни один сервис. Ужесточение регуляторных требований, рост стоимости оборудования и переход к практическому использованию искусственного интеллекта усложняют управленческие решения и превращают инфраструктуру в одну из ключевых статей ИТ-затрат. В статье Алексей Зотов, руководитель направления ИТ-инфраструктуры «К2Тех», рассматривает, как меняется экономика корпоративной инфраструктуры и подходы к управлению рисками в новых условиях.
Регуляторика как драйвер обязательных инвестиций
За последние полгода регуляторы серьезно пересобрали контур требований к КИИ: появились методики категорирования и конкретные требования к подсистемам, утверждены официальные перечни объектов, обновлен приказ ФСТЭК по защите инфраструктуры, а также анонсированы метрики, по которым раз в полгода будут оценивать уровень защищенности. Поэтому откладывать переход на отечественный стек уже не получится.
Фактически формируется новый сегмент доверенного железа: для включения в реестр уже недостаточно формальной сборки, производитель должен набрать необходимое количество баллов за технологические операции на территории РФ, использование российской электронной компонентной базы и наличие прав на конструкторскую документацию.
При этом под требования локализации попадает не только «железо», но и программное обеспечение: в реестре должны быть не только прикладные компоненты, но и низкоуровневый софт — BIOS, прошивки и другие составные части решения. Если вендор использует зарубежные или open source‑компоненты, которыми не владеет и которые нельзя включить в реестр, это серьезно усложняет для него попадание в сегмент доверенного оборудования.
ИИ и китайские GPU: новый запрос к инфраструктуре
Глобальный рынок ИИ-технологий меняется с огромной скоростью: искусственный интеллект из области экспериментов превратился в операционный инструмент. Если пару лет назад ИИ-проекты выглядели как «витринные пилоты», то сейчас у большинства крупных компаний уже есть конкретные сценарии: от транскрибации и суммаризации, чат‑агентов для поддержки сотрудников и клиентов, автоматизации бэк‑офисных процессов до скоринговых моделей, систем мониторинга технологического оборудования и ИИ‑помощников для разработчиков и операторов инфраструктуры.
На переходном этапе от хайпа к взрослению заказчики научились считать ROI и бизнес-эффект, однако при этом вычислительных ресурсов и памяти нужно все больше. Получается парадокс, ведь ИИ наконец приносит ощутимую пользу, но без адаптации под новые реалии его будет все сложнее масштабировать.
На этом фоне классический путь — строить ИИ‑кластер только на Nvidia — становится не только технически, но и экономически все менее подъемным. Ограничения на поставки в ряд стран, дефицит топовых ускорителей и рост цен приводят к тому, что сервер с восемью современными картами уровня B‑серии может стоить под миллион долларов. Для большинства компаний это означает простой выбор: либо резко сокращать амбиции по ИИ‑нагрузкам, либо искать альтернативы.
Сегодня в качестве такой альтернативы компании действительно все чаще присматриваются к китайским GPU, тестируют их на своих задачах, и это уже рыночная реальность. На китайском рынке уже сформировалась группа вендоров, способных частично замещать Nvidia. По оценкам аналитиков, их совокупная доля достигла около 41% внутреннего рынка серверных ИИ-ускорителей, а наиболее сильные позиции среди локальных игроков занимает Huawei с долей порядка 20%.
В типовых сценариях эти решения достойно проявляют себя, например, для инференса моделей, запуска агентов, проверки гипотез. Помимо Huawei все чаще упоминаются MetaX (китайский чипмейкер) и Moore Threads (китайская компания, специализирующаяся на разработке и производстве графических процессоров и решений для ускоренных вычислений), которые закрепляются как заметные производители в локальной экосистеме.
Раньше китайские ИИ‑модели в основном оптимизировали под библиотеки и стек Nvidia, а работа на китайских картах шла через эмуляцию. Сейчас появляется нативная поддержка китайских GPU.
Отечественные ИИ-модели в большинстве своем базируются либо на решениях с открытым исходным кодом, либо на китайских моделях. Если в одном из сценариев поддержку Nvidia со временем исключат из этих моделей, это отразится и на российских разработках. Управлять этим риском означает заранее учитывать сценарий перехода на китайские видеокарты: от выбора площадок и поставщиков до подготовки команд эксплуатации и адаптации стека фреймворков.
Новая экономика железа: рост цен и неопределенность
Если посмотреть на рынок железа, цены на оперативную память и диски растут и остаются высокими, заметных тенденций к снижению нет. Мы видим, как крупные вендоры уровня мировых брендов перестают фиксировать цены для клиентов: коммерческие предложения живут буквально часы, в контрактах появляются формулировки о праве пересмотра стоимости.
Параллельно возникают новые практики, такие как покупка сервера без оперативной памяти и предложение самостоятельно искать DDR5, потому что с ней сложнее и дороже. В такой ситуации классическая модель «запланировали закупку на три года вперед по понятному прайсу» перестает работать, а проектирование инфраструктуры под новые требования означает серьезный пересмотр бюджета.
Дополнительную неопределенность вносят изменения в режимы поставок и параллельного импорта, особенно в части компонентов ключевых производителей памяти и дисков. В наиболее уязвимом положении оказывается продукция Samsung, ведь производитель физически присутствует в РФ, поэтому может потребоваться согласие правообладателя на ввоз оборудования. В этом случае ограничения ударят по доступности и ценам на оперативную память и жесткие диски.
От хаотичных закупок к рациональному управлению
В этих условиях самая рациональная реакция — не бежать сразу за новым железом, а сначала разобраться, насколько эффективно используется уже купленное. Это означает переход от интуитивного управления ресурсами к дисциплине утилизации. Это быстрый и относительно недорогой способ найти «скрытые» ресурсы, прежде чем закладывать сотни миллионов на новую линейку серверов.
Второй вариант — в качестве компромиссных решений рассматривать процессоры и память предыдущих поколений. Российские производители процессоров четвертого, пятого, шестого поколений фактически появились только в течение последнего года. До этого рынок жил на третьем поколении и памяти DDR4, и для многих сценариев это абсолютно разумный выбор.
Конечно, не стоит пытаться строить на таком оборудовании высоконагруженные вычисления или продуктивные базы данных. Речь идет о том, чтобы разделить инфраструктуру на классы:
- критичные нагрузки и ИИ — на самом современном стеке;
- базовые инфраструктурные сервисы — на прошлых поколениях, но с грамотным управлением.
Третий вариант — экосистемный подход, при котором компания платит за контур, а не за конструктор из разрозненных продуктов, каждый со своим циклом закупки и скрытыми затратами на интеграцию. Если раньше «поменять почту» означало просто выбрать новый почтовый сервер, то сегодня заказчики мыслят масштабом пользовательской экосистемы: почтовый клиент, календарь, корпоративный мессенджер, офисный пакет, файлообменник, трекер задач, доски должны работать как единое решение.
Ограничения работы глобальных мессенджеров лишь ускорили этот переход. Компании переводят коммуникации в локальный контур и заодно пересматривают набор сервисов, отказываясь от разрозненных подписок в пользу единого контура, который проще защищать, поддерживать и планировать по бюджету.
Инвестиции, а не затраты
На фоне бюджетных ограничений внедрений ради внедрений никто не делает, сейчас все изменения измеряются конкретным бизнес-эффектом. Инфраструктура требует от ИТ-директора компетенций инвестора, чтобы бизнес видел в ИТ не только расходы, но и ощутимую отдачу.
Те, кто перестраивает ИТ-бюджет вокруг утилизации, приоритизации критичных нагрузок, технологической гибкости и экосистемного подхода, получают шанс не только сдерживать рост инфраструктурных расходов, но и использовать текущий цикл изменений как возможность укрепить технологический суверенитет и управляемость ИТ-затрат.
