«Четыре дракона» китайского GPU: как Китай начал строить свой рынок

За один год четыре китайских GPU-стартапа прошли путь от биржевых обещаний до миллиардной выручки. В марте и апреле 2026 года MetaX, Moore Threads, Biren Technology и Iluvatar CoreX опубликовали первые годовые отчеты после IPO, и по ним уже видно, что это больше не история про подготовку к конкуренции с NVIDIA. Это рынок с реальными продажами, реальными кластерами и клиентами, которые уже перешли на китайские чипы.

Эти компании часто называют «четырьмя маленькими драконами» китайского GPU-рынка. В 2025 году их совокупная выручка достигла 5,2 млрд юаней (750 млн долл. или 56,2 млрд руб.). Рост у всех заметный, от 92% до 243% год к году. Прибыльной эту историю пока назвать нельзя, все четыре компании остаются в убытке, но три из них уже сократили потери. Именно это показывает, что рынок явно вышел из стадии вечного R&D и перешел к коммерческому масштабированию.

В статье эксперты ООО «ЧАЙТЕКС» разбирают, что происходит с китайскими GPU, почему главный рост теперь дает инференс и что эта новая реальность значит для российского рынка.

Цифры, говорящие сами за себя

MetaX из Шанхая показала выручку 1,64 млрд юаней, или около 239 млн долл. (17,9 млрд руб.). Рост составил 121%, а убыток сократился на 44% и достиг 789 млн юаней (8,7 млрд руб.).

Moore Threads, тоже шанхайская компания, заработала 1,51 млрд юаней, или около 219 млн долл. (16,4 млрд руб.). Здесь самый резкий рост среди всей четверки — 243% за год. Убыток снизился на 37% и составил 1,024 млрд юаней (11,2 млрд руб.).

Biren Technology из Гонконга получила 1,03 млрд юаней выручки, около 145 млн долл. (10,9 млрд руб.). Рост составил 207%, но убыток, в отличие от остальных, увеличился на 14% и достиг 874 млн юаней (9,6 млрд руб.). Компания объясняет это расходами на R&D и расширение производства. Для стартапа на такой стадии это выглядит не катастрофой, а платой за скорость.

Iluvatar CoreX также показала 1,03 млрд юаней выручки, около 145 млн долл. (10,9 млрд руб.). Рост составил 92%, а убыток сократился на 32% и оказался на уровне 438 млн юаней, около 4,8 млрд руб.

По абсолютной выручке впереди MetaX, но самый громкий рывок сделала Moore Threads. Причем важен не только процент роста, а характер продаж. В марте 2026 года компания подписала контракт на 660 млн юаней (7,2 млрд руб.) на поставку интеллектуального кластера KUAE. Можно сказать, что это тот самый переход к продаже готовой ИИ-инфраструктуры, то есть к модели ИИ-фабрик, который NVIDIA много лет обкатывала по всему миру.

Именно здесь хорошо видно, как меняется спрос. Компании больше не покупают ускорители ради пилотов, теперь им нужна инфраструктура, на которой можно запускать нейросети в рабочих сценариях, с понятной поддержкой, софтом и предсказуемой экономикой.

Инференс — новый главный двигатель

Главный рост теперь дают не кластеры для обучения моделей, а инфраструктура для инференса, то есть для запуска и обслуживания уже обученных моделей.

У MetaX продажи инференсных GPU-карт выросли на 866% за год. Это в разы быстрее, чем продажи универсальных карт для обучения и инференса. В свою очередь, Iluvatar сообщила о росте выручки от инференсной линейки Zhikai на 238%, и эта динамика тоже обогнала тренировочные продукты.

Biren Technology в годовом отчете указала, что распространение AI-агентов создает мультипликативный спрос на вычисления, потому что один вызов агента может порождать десятки инференс-запросов. Это, пожалуй, главный сдвиг во всей истории китайских GPU.

Когда ИИ был в основном чат-ботом, пользовательский запрос выглядел относительно просто: «Человек спросил — модель ответила». С агентами все становится сложнее, ведь система планирует, проверяет гипотезы, вызывает инструменты, уточняет данные, исправляет собственные шаги и на каждом этапе снова обращается к модели. Один запрос превращается в маленькую вычислительную экспедицию, где за кадром происходит гораздо больше работы, чем видит пользователь.

Поэтому спрос на инференсные мощности растет быстрее, чем спрос на обучение. Кроме того, у инференса другая экономика — регулярная нагрузка, понятное потребление, высокая загрузка оборудования и более предсказуемая выручка.

NVIDIA возвращается, но рынок уже поменялся

На GTC 2026 Дженсен Хуанг объявил о перезапуске производства H200 для китайского рынка. NVIDIA получила экспортные лицензии, заказы уже находятся в работе. Blackwell при этом остается под запретом, поэтому Китай получает не самое новое поколение, а второе по мощности решение.

Это должно было бы ослабить позиции китайских производителей — NVIDIA возвращается, значит, местные игроки снова оказываются в роли временной замены. Однако отчеты «четырех драконов» показывают, что пока NVIDIA была ограничена в поставках, китайские компании успели собрать клиентскую базу, довести продукты до коммерческого масштаба и уже начать продавать инфраструктуру, а не только чипы.

Доля китайских чипов на внутреннем рынке AI-серверов в 2025 году достигла 41%:

Huawei занимает 24%;
Cambricon 5%;
Baidu Kunlun 4%;
MetaX 3%;
Iluvatar 3%.

В итоге чипы NVIDIA остаются желанными, но перестают быть единственным вариантом. H200 вернется на рынок, где уже есть конкуренты с реальными нагрузками и заказчиками.

Причем вернется без Blackwell, который, по нашему мнению, сейчас остается самым привлекательным продуктом NVIDIA. Это не отменяет силы компании, но меняет весь расклад на рынке. Китайские производители получили время, клиентов и шанс доказать, что их решения могут работать не только в режиме политической необходимости.

SMIC выходит на 5 НМ

Масштабирование китайского GPU-рынка невозможно без собственной производственной базы. И здесь тоже происходят события, которые важны не меньше отчетов стартапов.

SMIC, крупнейший литейный производитель Китая, ведет пилотные запуски 5-нм процесса, который обозначается как N+3. По данным TechInsights, N+3 выглядит как масштабируемая эволюция 7-нм процесса и приближается к 5-нм эквиваленту без EUV-литографии. Важно, что речь не о прямом повторении пути TSMC, а о попытке выжать максимум из доступного оборудования и процессов.

Semiconductor Manufacturing International Corporation (SMIC) // Источник: morethantech.it

В 2026 году SMIC также планирует удвоить мощности по 7 нм. В январе компания выкупила пекинский филиал за 5,79 млрд долл (434 млрд руб.). Это похоже на консолидацию контроля над ключевыми производственными активами.

Есть и резервная линия. Hua Hong, второй по величине китайский литейщик, по данным Reuters, разработал 7-нм технологию, пригодную для производства ИИ-чипов. Это важно на случай, если SMIC не справится с растущим спросом или рынку понадобится дополнительная производственная опора.

Слабое место у этой конструкции тоже есть. По разным оценкам, на мощностях SMIC выход годных чипов Huawei Ascend 910C составляет всего 20–40%, что заметно ниже привычных для отрасли показателей. Для обычного коммерческого проекта такая эффективность выглядела бы тревожно, если не сказать болезненно. Однако в китайском случае счет идет не только в процентах выхода и себестоимости.

ИИ-чип Huawei Ascend 910C. Источник: Baidu. — ИИ-чип Huawei Ascend 910C. Источник: Baidu

Собственное производство AI-чипов стало вопросом технологической устойчивости, поэтому дорогой и пока неидеальный техпроцесс воспринимается как плата за независимость от поставок, которые в любой момент могут исчезнуть по политическому решению.

SOFTWARE-DEFINED CHIPS ставка на обход CUDA

Железо решает только половину задачи. Главная сила NVIDIA давно не сводится к GPU как физическому устройству. Ее настоящее преимущество в CUDA, библиотеках, инструментах, фреймворках, накопленной экспертизе разработчиков и огромном количестве кода, который уже написан под эту экосистему.

Китай это понимает, поэтому пытается не просто копировать CUDA, а искать обходной маршрут. На отраслевых саммитах по полупроводникам профессор Университета Цинхуа Вэй Шаоцзюнь продвигает подход, при котором архитектура чипа определяется программными задачами и может адаптироваться под них, а не остается жестко зафиксированной, как в классических GPU. В индустрии этот подход часто описывают как Software-Defined Chips (SDC).

SDC предполагает, что чип может динамически переконфигурироваться под конкретную задачу, а компилятор генерирует битстрим, напрямую управляющий потоками данных. Разработчик получает более низкоуровневый контроль над вычислением, который традиционные универсальные GPU обычно не дают.

Звучит сложно, рискованно и местами почти как инженерная ересь, но в этом и смысл. Китай не пытается догнать NVIDIA в ее собственной экосистеме — он пробует сделать так, чтобы сама зависимость от CUDA стала слабее.

Особенно интересен SDC для инференса, то есть для того рынка, который сейчас растет быстрее всего. В edge-устройствах, промышленном IoT и встраиваемых системах универсальность классических GPU часто оказывается избыточной, потому что там важнее не запас мощности «на всякий случай», а эффективность, энергопотребление, предсказуемость и точная настройка под конкретную задачу.

Если SDC действительно даст выигрыш в таких сценариях, он может вырасти из архитектурного эксперимента в отдельное направление AI-ускорителей. Хотя для этого и придется заново собирать почти весь привычный слой разработки — инструменты, фреймворки, подходы к оптимизации и саму культуру работы с железом.

Подписывайтесь на наш Telegram Подписаться

Что это значит для российского рынка

Для России отчеты «четырех драконов» — практический ориентир для компаний, которые прямо сейчас выбирают AI-инфраструктуру и пытаются понять, на что закладываться в ближайшие годы.

Большинство компаний в нашей стране не обучают фундаментальные модели с нуля, а запускают и адаптируют уже готовые решения вроде DeepSeek, Qwen или Kimi под поддержку, аналитику, корпоративные ассистенты и внутреннюю автоматизацию. Поэтому при выборе ускорителей важны не только пиковые TFLOPS, но и стоимость обслуживания запроса, стабильность при постоянной нагрузке, энергопотребление, совместимость с фреймворками и качество программного стека.

В этом сценарии китайские GPU, особенно инференсные линейки MetaX C550/C600, Moore Threads S4000/S5000 и Iluvatar BiV150, могут быть рациональнее универсальных NVIDIA-карт, если разница в цене действительно достигает двух-трех раз.

Дополнительный аргумент в их пользу связан с тем, что китайские производители постепенно переходят от продажи отдельных плат к поставке готовых кластеров с программным слоем и поддержкой. Например, по контракту Moore Threads на 95,5 млн долл. (7,2 млрд руб.) заказчик получает не набор компонентов, а инфраструктуру, которую можно быстрее довести до промышленной эксплуатации.

Графический процессор Moore Threads повышает производительность WebGL в 10 раз, снижая нагрузку на центральный процессор на 70 % // Источник: en.mthreads.com

Отдельно стоит учитывать производственную базу. SMIC развивает 5-нм направление, Hua Hong работает над 7-нм технологией для AI-чипов, а расширение мощностей должно снизить зависимость от единичных производственных линий. Для следующих поколений китайских GPU, включая MetaX C700 и будущие решения Moore Threads 2026–2027 годов, это означает более зрелый техпроцесс, больше доступных партий и меньший риск дефицита на стороне поставщика.

Поэтому 41% внутреннего китайского рынка ИИ-серверов важны как признак оформления новой экосистемы. Миллиардная выручка у нескольких производителей, быстрый рост инференсных продаж и расширение литейных мощностей показывают, что китайские GPU уже вышли за рамки временной замены NVIDIA.

В итоге можно долго ждать идеального возвращения привычных поставщиков в Россию, но инфраструктуру для ИИ придется строить на том рынке, который формируется сейчас.

Смена парадигмы от «гонки терафлопс» к «экономике инференса»

Если собрать эти данные вместе, можно сделать вывод о том, что рынок ИИ-железа меняется глубже, чем кажется по новостям о санкциях, экспортных лицензиях и новых техпроцессах. Китайские компании конкурируют с NVIDIA уже не только за отдельные поставки. Они входят в тот участок рынка, где решает не максимальная мощность в таблице характеристик, а стоимость постоянной работы модели, стабильность кластера и способность обслуживать растущий поток ИИ-запросов.

Раньше ускорители чаще оценивали через обучение — насколько быстро карта обработает большой датасет, сколько времени уйдет на тренировку модели, какой результат получится на пике нагрузки. Сейчас центр тяжести смещается к инференсу. ИИ-сервисы становятся сложнее, и один пользовательский запрос все чаще запускает не один ответ модели, а цепочку вычислений. Агент планирует, проверяет данные, вызывает инструменты, уточняет промежуточные результаты и снова обращается к модели на каждом шаге.

Из-за этого меняется экономика инфраструктуры. Обучающие кластеры остаются нужными, но они дороги, сложны и зависят от циклов разработки новых моделей. Инференсная инфраструктура работает постоянно, ее нагрузку проще прогнозировать, а стоимость ошибки или простоя быстро становится понятной в деньгах. Именно на этом слое будет держаться массовое внедрение ИИ в продукты, поддержку, аналитику и внутренние корпоративные процессы.

В итоге в России выбирать придется не бренд, а конкретную экономику, задачи, тип нагрузки, доступность поставок и готовность жить в мире, где идеального универсального варианта больше нет.

Читайте также: