Т1 Облако расширяет линейку сервисов с использованием графических процессоров (GPUaaS), чтобы клиенты могли оптимально подбирать ускорители под различные бизнес-задачи. Это позволяет оптимизировать затраты на высокопроизводительную инфраструктуру, соблюдая баланс между мощностью и экономичностью.

Для самых требовательных задач, таких как инференс масштабных языковых моделей (LLM), высокопроизводительные вычисления (HPC) и построение суперкомпьютерных систем, представлен сервис на основе NVIDIA H200. По сравнению с предыдущим поколением H100, он позволяет проводить инференс крупных LLM в два раза быстрее благодаря увеличенному объему видеопамяти до 141 ГБ и высокой пропускной способности.
Клиентам доступны конфигурации от 1 до 8 карт на виртуальную машину, соединенных высокоскоростной сетью InfiniBand. Это решение подходит для обработки больших данных в реальном времени в сферах финансового анализа, разведки полезных ископаемых, научного моделирования и разработки корпоративных ИИ-приложений.
«Мы фиксируем взрывной рост интереса к ИИ-решениям, для которого требуется все больше производительных вычислительных ресурсов. Облачные сервисы на базе GPU — стратегическое направление для Т1 Облако, и мы продолжаем его развивать. NVIDIA H200 и L40S последовательно усиливают нашу линейку GPUaaS: это одни из самых популярных моделей на рынке, и наши клиенты уже демонстрируют к ним высокий интерес».
Георгий Джабиев, директор по развитию бизнеса Т1 Облако
Для задач обучения средних ML-моделей, 3D-рендеринга, визуализации, проектирования и медиаобработки предлагаются облачные вычисления на базе NVIDIA L40S с 48 ГБ памяти. Эти универсальные ускорители являются эффективным решением для малого и среднего бизнеса, которому не требуются флагманские GPU. Доступны конфигурации от 1 до 8 карт на виртуальную машину.
