Компания OpenAGI представила модель Lux, способную автономно управлять компьютером через анализ экрана. По данным стартапа, ее эффективность на отраслевом тесте превосходит показатели решений от OpenAI и Anthropic.

Основатель и CEO OpenAGI Цзэнъи Цинь, исследователь из Массачусетского технологического института (MIT), заявил, что Lux показала результат в 83.6% успеха в стандартном отраслевом тесте Online-Mind2Web, который считается наиболее строгим для оценки подобных агентов. Для сравнения, модель Operator от OpenAI набрала 61.3%, а Claude Computer Use от Anthropic — 56.3%.
Ключевое отличие технологии Lux, по словам Цинь, заключается в подходе к обучению. Если традиционные языковые модели обучаются на больших объемах текста, то Lux обучается непосредственно на скриншотах и последовательностях действий, что позволяет ей генерировать команды для управления компьютером.
Анонс состоялся в период активной конкуренции на рынке автономных ИИ-агентов. Крупные технологические компании, включая Google и Microsoft, уже инвестируют миллиарды долларов в разработку подобных систем, способных выполнять сложные задачи, от бронирования до управления рабочими процессами, предвидя, что этот тип искусственного интеллекта может стать следующим шагом после чат-ботов.
