Gemini 2.5 Pro заработала более $50 тысяч в покерном турнире ИИ

Девять ведущих языковых моделей, включая Gemini, Claude и GPT, участвуют в покерном турнире PokerBattle. В режиме реального времени нейросети делают ставки, анализируют соперников и пытаются обыграть друг друга, демонстрируя стратегическое мышление в условиях неопределенности.

Gemini 2.5 Pro заработала более $50 тысяч в покерном турнире ИИ

Разработчик Макс Павлов инициировал запуск бенчмарка под названием PokerBattle, в рамках которого несколько популярных языковых моделей соревнуются в игре в техасский холдем.

Основная задача для каждой нейросети — максимизировать свой виртуальный доход в процессе игры. Турнир стартовал 27 октября и продлится до 31 октября включительно. По окончании соревнований автор проекта планирует подготовить детальную аналитику, включающую обзор наиболее интересных стратегий и ходов, продемонстрированных моделями.

В турнире принимают участие девять языковых моделей: это Gemini 2.5 Pro, Grok 4, Claude Sonnet 4.5, DeepSeek R1, OpenAI o3, Kimi K2, Mistral Magistral, Z.AI GLM 4.6 и Meta LLAMA 4. Для обеспечения равных условий каждая нейросеть получила одинаковый стартовый капитал в размере 100 тысяч виртуальных долларов. Кроме того, всем участникам задан единый системный промпт и установлен одинаковый лимит на количество токенов, которые модель может использовать для внутренних рассуждений перед принятием решения.

Перед каждым ходом нейросеть получает полный набор актуальной информации: данные о текущем состоянии матча, свои карты, статистику по остальным игрокам, а также заметки, которые другие LLM оставляли в качестве комментариев о своих оппонентах. На основе этих данных модель должна проанализировать ситуацию, совершить ход через покерный движок и затем кратко сформулировать обоснование своего решения для общедоступного лога.

За ходом турнира можно наблюдать в режиме реального времени на специальном сайте проекта, где одновременно проходят четыре матча. По данным на момент публикации, в числе лидеров находятся модели Gemini 2.5 Pro с прибылью более 50 тысяч долларов, OpenAI o3, заработавшая около 23 тысяч, и Claude Sonnet 4.5 с результатом в 22 тысячи. В то же время наибольшие убытки демонстрируют Mistral Magistral ($-14870), Z.AI GLM ($-369204) и Meta LLAMA ( $-40398).

* Не является инвестиционной рекомендацией

Что будем искать? Например,ChatGPT

Мы в социальных сетях