Команда из России стала победителем чемпионата по стратегическому мышлению для ИИ-агентов

Компьютерра 09 декабря 2025 12:29

На чтение: 2 минуты

Нравится:

Искусственный интеллект, обученный российскими специалистами, одержал победу на престижной международной конференции NeurIPS 2025. Модель показала наилучшие результаты в состязании, где оценивались не вычислительные способности, а социальный интеллект.

На конференции по искусственному интеллекту NeurIPS 2025 завершилось соревнование MindGames Arena, где искусственный интеллект проверяли на социально-стратегические навыки. Агенты на базе языковых моделей должны были демонстрировать умение кооперироваться, предугадывать намерения, строить многоходовые планы и распознавать обман, общаясь на естественном языке в рамках длительных многораундовых игр.

Команда Института AIRI, Университета Иннополис и стартапа Coframe заняла первое место в треке Generalization, представив лучшее из более чем двухсот решений. Победа была одержана в двух категориях: для компактных открытых моделей и в абсолютном зачете без ограничений.

Агенты соревновались в трех играх. В «Codenames» они работали в командах, где один агент давал подсказки, а другой угадывал слова, избегая ловушек. В «Colonel Blotto» участники дуэли распределяли ограниченные ресурсы по нескольким полям, пытаясь перехитрить соперника. В «Дилемме заключенного на троих» три агента должны были через диалог формировать альянсы, решая, кому доверять, а кого обмануть, для максимизации своего результата.

Главной сложностью для ИИ было отсутствие полной информации и необходимость принимать решения в условиях длительных диалогов без прямого вознаграждения за каждый шаг. Для победы команда разработала специальный фреймворк. Он включает методы для эффективного обучения с подкреплением в распределенных системах, стратегии ранней остановки симуляций, сбалансированную выборку данных для обучения и асинхронный движок для параллельных запросов к модели.

По словам Ильи Макарова, ведущего научного сотрудника Института AIRI, победа в обоих треках показывает, что продуманная архитектура, обучение с подкреплением и устойчивые стратегии позволяют относительно небольшой модели успешно конкурировать с более крупными, в том числе проприетарными решениями.

Подписывайтесь на наш Telegram Подписаться