Институт AIRI представил инструмент для удешевления вычислений при разработке ИИ

Институт AIRI опубликовал в открытом доступе фреймворк KernelEvo, предназначенный для автоматической оптимизации GPU-ядер. Разработка позволяет ускорять ключевые операции искусственного интеллекта и снижать затраты на инфраструктуру без привлечения дефицитных специалистов по низкоуровневому программированию.

Институт AIRI представил инструмент для удешевления вычислений при разработке ИИ

Современные ИИ-системы работают на графических ускорителях, где выполняются специализированные программы — GPU-ядра, реализующие ключевые математические операции. Универсальные библиотеки не всегда обеспечивают максимальную производительность в конкретных задачах. В реальных проектах часто требуется объединять несколько операций или адаптировать код под особенности архитектуры, и компании пишут собственные ядра вручную. Однако разработка такого кода — трудоемкий процесс, требующий высокой квалификации: инженеры вручную подбирают параметры параллелизации, тестируют различные конфигурации и профилируют результат. Этот цикл может занимать дни и недели, а специалисты по низкоуровневой оптимизации остаются дефицитным ресурсом.

KernelEvo предлагает автоматизировать этот процесс. Вместо ручного перебора гипотез система сама генерирует варианты реализации на CUDA или Triton, запускает тесты, анализирует ошибки и повторяет цикл, превращая оптимизацию в автоматический поиск эффективных решений. Хотя сам процесс генерации требует вычислительных ресурсов, он становится экономически оправданным при регулярном использовании и масштабировании на множество задач.

В индустрии сегодня применяются разные подходы к написанию GPU-кода: полностью ручная разработка, использование языковых моделей в качестве ассистента, автоматические циклы с обратной связью и полностью автономные агенты. KernelEvo относится к третьему сценарию, который позволяет снизить долю ручного труда и применять наработанные методы оптимизации для разных задач без привлечения узких специалистов.

Для бизнеса производительность GPU-ядер напрямую влияет на экономику проектов. Ускорение ключевых операций в полтора-два раза сокращает время обучения моделей, снижает затраты на облачную инфраструктуру и дает возможность работать с более крупными моделями в рамках прежнего бюджета. В компаниях с крупными вычислительными кластерами такие изменения приводят к значительной экономии.

Как отметил генеральный директор Института AIRI, доктор физико-математических наук Иван Оселедец, в условиях растущей конкуренции компании борются не только за качество моделей, но и за эффективность их разработки. Автоматическая эволюция GPU-ядер становится инструментом, который повышает устойчивость бизнеса и снижает стоимость вычислений без необходимости закупать более мощное оборудование.

Что будем искать? Например,ChatGPT

Мы в социальных сетях