Все, что нужно знать об Auto-GPT: установка, обзор и сравнение с ChatGPT

  1. Что такое Auto-GPT
  2. Кто создал Auto-GPT
  3. Как работает Auto-GPT
  4. Возможности Auto-GPT
  5. Почему Auto-GPT стал популярен
  6. Как установить Auto-GPT
  7. AgentGPT — простой способ использовании Auto-GPT
  8. ChatGPT vs Auto-GPT
  9. Личный опыт и сравнение на практике

Искусственный интеллект наделал немало шума благодаря расширенным возможностям генеративных моделей ИИ, таких как ChatGPT. Недавно на рынке появлилось потенциально более мощное приложение ИИ — Auto-GPT.

Многообещающие автономные способности этого приложения могут стать первым проблеском искусственного интеллекта общего назначения (AGI) — тип ИИ, способный выполнять интеллектуальные задачи на уровне человека. 

С момента выхода приложения 30 марта 2023 года, Auto-GPT покорил людей, и стал одной из самых горячих тем в Twitter. Редакция «Компьютерры» несколько дней пользовалась Auto-GPT и теперь делится честным гайдом, в котором есть все, что нужно знать об Auto-GPT на текущий момент. 

Что такое Auto-GPT

Auto-GPT — экспериментальное приложение на Python с открытым исходным кодом, которое использует GPT-4 для автономной работы. 

Простыми словами, Auto-GPT может выполнять задачи без вмешательства человека и сам для себя писать промпты. Пользователь просто указывает Auto-GPT конечную цель, а приложение самостоятельно подготовит все промпты, необходимые для выполнения задания.

Кто создал Auto-GPT

Auto-GPT был размещен на GitHub 30 марта 2023 года разработчиком Significant Gravitas. Приложение управляется GPT-4, который является последней и наиболее продвинутой моделью ИИ от OpenAI. 

Как работает Auto-GPT

Auto-GPT, построенная на модели GPT-4, позволяет ИИ функционировать независимо и без постоянного участия пользователя. Auto-GPT работает на основе автономного механизма ИИ, разбивая задачу на несколько подзадач и создавая различных агентов ИИ для выполнения этих задач. 

Агенты ИИ включают в себя: 

  • Агент создания задачи: Когда вы предоставляете свои задачи Auto-GPT, первым агентом, который взаимодействует с вами, чтобы начать процесс работы над задачей, является агент создания задачи. Этот агент создает список задач на основе ваших конечных целей с указанием шагов по их достижению и отправляет их агенту по расстановке приоритетов. 
  • Агент расстановки приоритетов задач: Получив список задач, агент расстановки приоритетов убеждается, что их правильная последовательность имеет логический смысл, и отправляет его агенту выполнения. 
  • Агент выполнения задачи: Как только приоритет подзадачи установлен, агент выполнения начинает выполнять эти задачи одну за другой, подключаясь к Интернету, GPT-4 и другим инструментам, необходимым для выполнения задачи. 

 

Эти три агента также взаимодействуют друг с другом, пока задача не будет выполнена. Например, когда агент выполнения завершает шаги, но результаты не соответствуют желаемым, он связывается с агентом создания задач, который может создать новый список задач для достижения конечной цели. Этот процесс создает интерактивный цикл между всеми тремя агентами, пока они не смогут сгенерировать результат, определенный пользователем. 

 

Пока эти агенты выполняют свои задачи, их действия отображаются на пользовательском интерфейсе с помощью четырех категорий: 

 

  • Мысли: Агент ИИ делится своими мыслями после выполнения каждого задания. 
  • Рассуждения: Агенты ИИ объясняют причину своих действий, отвечая на вопрос, зачем нужно выполнять каждый шаг. 
  • План: Система предлагает стратегический план выполнения поставленной задачи. 
  • Критика: Затем система предоставляет критику, позволяя агентам ИИ преодолеть свои ошибки и исправить ошибки, если таковые имеются. 

 

Таким образом, этот вычислительный поток позволяет Auto-GPT получить представление о том, как подойти к решению конкретной задачи и исправить ошибки без вмешательства человека.

 

Возможности Auto-GPT

Согласно сообщению на Github, Auto-GPT имеет доступ в интернет, может управлять долгосрочной и краткосрочной памятью, связывается с GPT-4 для генерации текста и хранения файлов, а также подводит итоги с помощью GPT-3.5. 

 

По сути, все что вы можете сделать с ChatGPT, например, отладить код или написать статьи, вы можете сделать и с Auto-GPT. Однако Auto-GPT способен справиться с более сложными задачами с меньшим количеством промптов со стороны человека.

 

В Твиттере пользователи делятся некоторыми способами использования Auto-GPT, среди которых — создание приложения, создание нового стартапа, изучение сложных тем, таких как будущее здравоохранения и медицины, и даже слежка за собой в интернете.

 

Одним из примеров сервиса на основе Auto-GPT является Chef-GPT, который исследует интернет, чтобы генерировать уникальные рецепты и сохранять их без вмешательства пользователя. Например, первоначальная «мысль» Chef-GPT заключалась в поиске предстоящих событий для создания уникального рецепта на основе «рассуждений» о том, что в результате получится актуальное и интересное блюдо. «Критик» ИИ оценивает потенциальные ограничения его действий, что еще больше подчеркивает его способность функционировать самостоятельно, достигая при этом определенных пользователем целей.

 

Другой пример — чат-бот ChaosGPT, который решил получить контроль над человечеством посредством манипуляций для обретения большей силы и ресурсов, которых у него пока нет. 

Почему Auto-GPT стал популярен

Auto-GPT быстро оказался в топе трендов в Twitter, потому что люди увлечены тем, что способен делать этот инструмент и как это повлияет на наше будущее. Способность Auto-GPT достигать целей посредством собственных рассуждений ставит ее в один ряд с тем, что делают люди и как они обрабатывают информацию. 

 

Поэтому появилось мнение, что Auto-GPT — первый настоящий проблеск AGI. ИИ, способный хорошо функционировать при минимальном контроле со стороны человека, может совершить революцию в работе, какой мы ее знаем, заменив многие функции, которые сейчас выполняют люди.

 

Как установить Auto-GPT

В отличие от ChatGPT, который имеет user friendly-интерфейс и простой доступ, Auto-GPT требует ручной установки на устройство. Процесс может показаться сложным, поэтому мы подготовили пошаговую инструкцию по установке Auto-GPT. 

Шаг 0: Создание безопасной среды 

Этот шаг не является обязательным, но мы, как и многие другие эксперты, настоятельно рекомендуем устанавливать Auto-GPT на виртуальной машине, чтобы снизить риски безопасности для вашего устройства и данных. Auto-GPT — это экспериментальный проект, который имеет возможность самостоятельно выходить в интернет и управлять вашим устройством, поэтому экспериментировать лучше в безопасной среде. В нашем случае мы использовали удаленный рабочий стол от Serverspace.

Шаг 1: Установка необходимого ПО

 

Для установки Auto-GPT потребуется Python, Git и Visual Studio Code. 

 

Ниже приведены ссылки на установку этих инструментов: 

 

Ссылка на установку Git

Ссылка на установку Python

Ссылка на установку Visual Studio Code

 

Шаг 2: Получить API-ключи от OpenAI

Следующим важным шагом после установки программного обеспечения является создание учетной записи OpenAI, если у вас ее еще нет. Создайте аккаунт на OpenAI или войти в него через эту страницу.

 

Открыв аккаунт, перейдите на вкладку API-ключей и нажмите на кнопку «Create new secret key».

 

Появится диалоговое окно. Нажмите “Create new secret key” еще раз, чтобы сгенерировать секретный ключ. Обязательно скопируйте его и сохраните где-нибудь на локальном устройстве, так как после генерации, сделать это не получится.

Шаг 3: Скопируйте репозиторий Auto-GPT на жесткий диск

Перейдите на страницу последнего релиза Auto-GPT на GitHub, прокрутите вниз страницы и нажмите на ссылку “Source Code (zip)», чтобы загрузить zip-файл.

Теперь извлеките этот zip-файл и скопируйте папку Auto-GPT, чтобы вставить ее в нужное место или на жесткий диск.

Вы также можете загрузить репозиторий через командную строку. Для этого скопируйте ссылку на проект со страницы релиза GitHub Auto-GPT. Для этого нажмите на «Code» в левой части окна и снова на зеленую кнопку «Code». Затем скопируйте URL-адрес HTTPS, который появится на экране.

Затем откройте командную строку, напишите “git clone” и вставьте ссылку репозитория Auto-GPT GitHub.

 

Так как у вас уже установлен Visual Code Studio, вы можете ввести код в командной строке и получить доступ к Auto-GPT из редактора Visual Code Studio.

Шаг 4: Установите модули Python

Откройте Visual Code Studio и откройте файл Auto-GPT в редакторе VCS. Нажмите на ссылку ‘Open Folder’ и откройте папку Auto-GPT в вашем редакторе.

Открыв файл Auto-GPT в редакторе VCS, вы увидите несколько файлов в левой части редактора. Если вы прокрутите немного вниз, то увидите один из файлов — ‘requirements.txt’.

В этом файле есть все необходимые модули, которые нужны для запуска Auto-GPT. Теперь нажмите на ‘Terminal’ в верхней части редактора VCS и выберите опцию ‘New Terminal’.

Затем введите команду pip install — r requirements.txt и нажмите enter, чтобы установить все необходимые модули. Важно убедиться, что каталог точно указывает на место, куда скопирован репозиторий.

Шаг 5: Переименование файла .env.template

Прокрутите список файлов в редакторе VCS и увидите файл .env.template. 

 

Щелкните на него правой кнопкой мыши и выберите опцию”’Rename”. Переименуйте этот файл, удалив «.template».

Шаг 6: Введите ключи API OpenAI

Последним шагом будет вставка секретного ключа OpenAI в переименованный файл .env, как показано ниже.

После того как вы вставите ключ, сохраните файл .env.

Также вы можете добавить и другие API, например, Pinecone для долгосрочной памяти.

Теперь перейдите в командную строку и введите команду python -m autogpt.

На этом установку AutoGPT можно считать завершенной. Пользовать инструментом придется прямо в VSC или командной строке. 

 

AgentGPT — простой способ использовании Auto-GPT

Как видно из инструкции выше, Auto-GPT не особенно прост в использовании. Если вы хотите использовать Auto-GPT, но избежать сложностей с установкой, то мы рекомендуем попробовать бета-версию AgentGPT. Она имеет свои ограничения, но вы можете получить представление о том, как работает полуавтономность Auto-GPT, и использовать ее для решения некоторых базовых задач. Если вы дадите ИИ слишком сложную задачу, он может начать ее выполнение, а затем отказаться от завершения, заявив: «Извините, но это демо-версия, мы не можем заставлять наших агентов работать слишком долго. Обратите внимание, если вы хотите более длительной работы, пожалуйста, предоставьте свой собственный ключ API в Настройках».

 

Поэтому для продолжения использования необходимо предоставить собственный API-ключ OpenAI в AgentGPT.

ChatGPT vs Auto-GPT

Несмотря на то, что ChatGPT является очень способным чат-ботом, он все еще чат-бот и ограничен тем, что дает ответы на вопросы, заданные ему через промпты. Он может совершать удивительные вещи, но только под руководством человека. 

 

Возможности Auto-GPT выходят далеко за рамки этого, ведь вы можете попросить его выполнить задание, о котором вы ничего не знаете, и просто наблюдать, как он делает всю работу за вас. 

 

Хотя и ChatGPT, и Auto-GPT являются большими языковыми моделями (LLM) OpenAI, между ними есть различия, поскольку они служат разным целям. Оба инструмента обучены на разных наборах данных и оптимизированы для выполнения разных задач. 

 

Вот несколько моментов, которые отличают Auto-GPT от ChatGPT: 

 

  1. Данные для обучения

ChatGPT в основном обучается на большой коллекции текстов, извлеченных из Интернета, сообщений в социальных сетях, книг, блогов и статей. Следовательно, он более способен и универсален в понимании человеческого языка. 

 

С другой стороны, Auto-GPT обучается на большой коллекции кода из StackOverflow, GitHub и подобных репозиториев кода. Благодаря этому набору данных Auto-GPT специализируется на понимании языков программирования, структур и синтаксиса. 

 

Таким образом, поскольку Auto-GPT гораздо глубже понимает, как написан конкретный код, он может генерировать точный и эффективный код, что позволяет ему ускорить процесс разработки кода для организаций и снизить риски ошибок в программном обеспечении. 

 

  • Инсайты в реальном времени

Последняя модель GPT-4 от ChatGPT обучена на тех же данных, что и GPT-3.5 и рассчитана только до сентября 2021 года. Следовательно, ChatGPT не может предоставить самую свежую информацию и сведения в реальном времени, поскольку не позволяет получить доступ к онлайн-платформам или веб-сайтам для извлечения информации. 

Напротив, Auto-GPT предоставляет доступ к интернету, серфингу в сети и проверяет, является ли источник данных легитимным. Более того, Auto-GPT может получить доступ к любому веб-сайту или онлайн-платформе для выполнения поставленной задачи. Например, на основе целей, которые вы предоставляете Auto-GPT, он может зайти на сайт Starbucks и заказать ваш напиток, а также составить и отправить электронные письма перспективным клиентам в соответствии с инструкциями. 

  • Преобразование текста в речь

Auto-GPT позволяет включить функцию преобразования текста в речь, введя в командной строке команду python -m autogpt -speak. Однако для этого необходимо вводить эту команду каждый раз, когда вы хотите взаимодействовать с Auto-GPT с помощью речи. 

 

  • Генерация изображений

В отличие от моделей ИИ, таких как ChatGPT, Auto-GPT может генерировать изображения, поскольку инструмент использует DALL-E. Вы должны предоставить API-доступ к DALL-E, чтобы включить функцию генерации изображений для вашего ИИ-агента. 

 

  • Оптимизация

В то время как OpenAI оптимизировал ChatGPT для согласованности и естественности в создании человекоподобного текстового вывода, Auto-GPT оптимизирован для скорости и точности в генерации кода, сокращая время, ошибки и уязвимости в программном обеспечении. 

 

  • Приложения

Вы можете использовать Auto-GPT для выполнения таких задач, как оптимизация кода, автоматическое завершение кода и резюмирование кода.

 

С другой стороны, ChatGPT широко используется для выполнения таких задач, как генерация текста, перевод языка и создание чат-ботов. Таким образом, если приложения ChatGPT направлены на повышение эффективности и улучшение коммуникации между машинами и людьми, то приложения Auto-GPT направлены на повышение точности и эффективности процесса разработки кода.

Личный опыт  и сравнение на практике

Редакция «Компьютерры» несколько дней тестировала Auto-GPT, AgentGPT и BabyAGI, чтобы поделиться с вами опытом использования. Если говорить кратко, то «стандартный» ChatGPT все еще лидирует с точки зрения практического применения, но есть несколько «но» . 

 

Как мы писали выше, у Auto-GPT есть множество преимуществ, которыми не владеет ChatGPT. Одно только наличие выхода в интернет значительно повышает ставки и увеличивает уровень генерируемого контента до невообразимого уровня. При всем этом, Auto-GPT все еще сырой продукт, пользоваться которым интересно пока только на уровне эксперимента. 

 

Главная проблема Auto-GPT в том, что он слишком много «думает». Странная претензия по отношению к ИИ, но именно это ограничивает его практическую ценность.

 

Auto-GPT зацикливается на мелких деталях задачи, снова и снова гуглит в поисках дополнительной информации, чтобы убедиться, что у него есть абсолютно лучшее решение. Наблюдать за ходом его «мыслей» очень интересно, но очень нерационально. В нашем эксперименте Auto-GPT по какой-то причине не знал, как делать то, что абсолютно точно умеет делать GPT-4. Например, если попросить его написать простейший скрипт Python для сложения двух чисел, он может начать искать учебник по Python, лучшие практики и придумает очень сложный план решения этой задачи. Также он имеет тенденцию застревать в петлях и продолжать решать проблемы способом, который очевидно не работает, поэтому несколько часов генерации оказываются потраченными зря и не приносят никакого результата. 

Сравнение на практике

В одной из глав выше мы описали, чем Auto-GPT лучше ChatGPT. Но это только теория и для объективного сравнения мы решили выполнить одну и ту же задачу с помощью двух этих инструментов. 

 

Перед Auto-GPT и ChatGPT мы поставили задачу по созданию классической игры «Змейка». Для чистоты эксперименты мы использовали один и тот же промпт, который выглядит следующим образом: 

 

Act as a game developer in python. Write code for the game snake in Python. 

ChatGPT

Мы использовали GPT-4 и получили готовый результат в виде python-кода через 30 секунд. Все, что нам осталось сделать для запуска игры — сохранить этот код в формате .py и запустить его через командную строку Windows. Результат и работу GPT-4 вы можете видеть на GIF-изображениях ниже.

Игра получилось довольно примитивной: змейка не видит полей игрового пространства, не может «съесть» саму себя, в игре отсутствуют очки, уровни и так далее. Но в целом это удовлетворительный результат, так как фактически мы все же получили базовую функциональность игры и немаловажно отметить, что и сам промпт у нас был довольно простым и если бы мы сделали его более детальным, то и результат был бы куда качественнее.

Теперь посмотрим на работу Auto-GPT.

Auto-GPT

Здесь использовали тот же самый промпт, что и в GPT-4, а генерация заняла…3 часа. Без лишних слов, посмотрите на работу Auto-GPT на GIF-изображении ниже. 

За это время Auto-GPT изучил, кажется, все варианты того, как должна выглядеть идеальная «Змейка», отправил сотни запросов в Google, поразмышлял над ними и поставил перед собой десятки вполне адекватных целей. Но игры мы, к сожалению, так и не увидели, даже с третьей попытки, потому что возникла очередная ошибка и Auto-GPT снова застрял в цикле.  

Так как вся работа Auto-GPT происходит в командной строке или VSC, то есть возможность наглядно увидеть, как «общаются» агенты, как пишут промпты и какие результаты получают. Поэтому, даже если вам не удалось решить свою задачу с помощью Auto-GPT, вы можете получить много полезной информации о ее решении. В нашем эксперименте видно, что код для игры инструмент все же нашел, даже определил спецификации, и кусочки его кода для игры могли бы собраться в нечто сильно интереснее, чем то, что сделал GPT-4. Это дает нам понять, что Auto-GPT действительно сильный инструмент с большими возможностями, которые пока, к сожалению, не удается оценить по достоинству. 

У инструмента есть потенциал и нужно ждать дальнейших обновлений и продолжать изучение. Наша редакция продолжит пользоваться и изучать функциональность Auto-GPT и дополнит этот материал, если в этом будет необходимость.

Что будем искать? Например,ChatGPT

Мы в социальных сетях