Чипы TPU восьмого поколения разработаны Google для суперкомпьютеров нового поколения

Компания Google анонсировала процессоры Tensor Processing Units (TPU) восьмого поколения, состоящие из двух отдельных чипов, предназначенных для обучения моделей искусственного интеллекта и для вывода результатов. Решение связано с ростом потребности в крупномасштабных ИИ-вычислениях.

Чипы TPU восьмого поколения разработаны Google для суперкомпьютеров нового поколения

Презентация прошла на конференции Google Cloud Next. Новые чипы получили названия TPU 8t и TPU 8i. Они работают на платформе Google AI Hypercomputer и охватывают задачи от обучения сложных моделей до обслуживания ИИ-агентов в промышленной среде.

TPU являются собственными ускорителями Google, ранее применявшимися во внутренних системах, включая Gemini. Теперь компания расширяет доступ к ним для клиентов, которые ищут альтернативу доминирующей инфраструктуре Nvidia. Оба чипа станут доступны широким пользователям во второй половине 2026 года.

TPU 8t оптимизирован для обучения больших ИИ-моделей. Один суперпроцессор может масштабироваться до 9600 чипов, обеспечивая вычислительную мощность 121 экзафлопс. По сравнению с предыдущим поколением Ironwood, производительность на один модуль выше почти в три раза. Улучшены доступ к хранилищу и сеть. Заявлена целевая эффективная производительность более 97% (время продуктивной работы без простоев), что критично для избежания задержек в крупных кластерах.

TPU 8i ориентирован на этап вывода, когда обученная модель отвечает на запросы и обеспечивает работу программных агентов. Чип оснащен 288 ГБ высокоскоростной памяти и 384 МБ встроенной SRAM, использует процессоры Google Axion на архитектуре Arm и улучшенную пропускную способность для моделей смешанного экспертного подхода (MoE). Производительность на доллар выше на 80% по сравнению с предыдущим поколением, что позволяет обрабатывать почти вдвое больше задач при тех же затратах.

В Google отметили, что стратегия двух чипов обусловлена эволюцией ИИ, требующей систем, способных рассуждать, запускать рабочие процессы и взаимодействовать с инструментами и другими моделями. Оба чипа обеспечивают до двух раз более высокую производительность на ватт, чем Ironwood, и используют жидкостное охлаждение четвертого поколения.

Новинка — часть усилий Google по созданию альтернативы Nvidia за счет сочетания собственных чипов, сетевых решений, программных фреймворков и облачных сервисов. TPU 8t и TPU 8i появятся в Google Cloud позднее в этом году. Чипы поддерживают фреймворки JAX, PyTorch, SGLang и vLLM, что позволяет запускать существующие ИИ-задачи без существенной переработки кода.

Читайте также: «Любой желающий сможет создать любую технику с помощью ИИ».

Что будем искать? Например,ChatGPT

Мы в социальных сетях