Компания Google анонсировала процессоры Tensor Processing Units (TPU) восьмого поколения, состоящие из двух отдельных чипов, предназначенных для обучения моделей искусственного интеллекта и для вывода результатов. Решение связано с ростом потребности в крупномасштабных ИИ-вычислениях.

Презентация прошла на конференции Google Cloud Next. Новые чипы получили названия TPU 8t и TPU 8i. Они работают на платформе Google AI Hypercomputer и охватывают задачи от обучения сложных моделей до обслуживания ИИ-агентов в промышленной среде.
TPU являются собственными ускорителями Google, ранее применявшимися во внутренних системах, включая Gemini. Теперь компания расширяет доступ к ним для клиентов, которые ищут альтернативу доминирующей инфраструктуре Nvidia. Оба чипа станут доступны широким пользователям во второй половине 2026 года.
TPU 8t оптимизирован для обучения больших ИИ-моделей. Один суперпроцессор может масштабироваться до 9600 чипов, обеспечивая вычислительную мощность 121 экзафлопс. По сравнению с предыдущим поколением Ironwood, производительность на один модуль выше почти в три раза. Улучшены доступ к хранилищу и сеть. Заявлена целевая эффективная производительность более 97% (время продуктивной работы без простоев), что критично для избежания задержек в крупных кластерах.
TPU 8i ориентирован на этап вывода, когда обученная модель отвечает на запросы и обеспечивает работу программных агентов. Чип оснащен 288 ГБ высокоскоростной памяти и 384 МБ встроенной SRAM, использует процессоры Google Axion на архитектуре Arm и улучшенную пропускную способность для моделей смешанного экспертного подхода (MoE). Производительность на доллар выше на 80% по сравнению с предыдущим поколением, что позволяет обрабатывать почти вдвое больше задач при тех же затратах.
В Google отметили, что стратегия двух чипов обусловлена эволюцией ИИ, требующей систем, способных рассуждать, запускать рабочие процессы и взаимодействовать с инструментами и другими моделями. Оба чипа обеспечивают до двух раз более высокую производительность на ватт, чем Ironwood, и используют жидкостное охлаждение четвертого поколения.
Новинка — часть усилий Google по созданию альтернативы Nvidia за счет сочетания собственных чипов, сетевых решений, программных фреймворков и облачных сервисов. TPU 8t и TPU 8i появятся в Google Cloud позднее в этом году. Чипы поддерживают фреймворки JAX, PyTorch, SGLang и vLLM, что позволяет запускать существующие ИИ-задачи без существенной переработки кода.
Читайте также: «Любой желающий сможет создать любую технику с помощью ИИ».