У OpenAI закончились графические процессоры. Новая версия ChatGPT оказалась настолько «прожорливой», что исчерпала вычислительные мощности компании. В статье рассмотрим эту новость, вспомним про дефицит GPU в мире и расскажем про новую модель ChatGPT.
Нет GPU — нет ИИ
На исходе февраля Сэм Альтман (Sam Altman) — CEO американского разработчика искусственного интеллекта OpenAI сообщил, что выход свежей ChatGPT-4.5 пришлось отложить для массового доступа из-за нехватки графических процессоров (видеокарт или GPU). На момент написания материала к новенькой версии чат-бота имеют доступ только «премиум» (ChatGPT PRO) подписчики, заплатившие компании от $200 (17 890 по курсу ЦБ).
Как заявил гендиректор компании, новая модель ChatGPT оказалась настолько мощной, что исчерпала весь имеющийся у OpenAI запас GPU.
«Мы значительно выросли и исчерпали запасы GPU. На следующей неделе добавим десятки тысяч GPU и развернем модель для уровня Plus… Это не идеальный сценарий, но предсказать всплески роста, ведущие к нехватке графических процессоров, сложно», — подчеркнул Альтман.
Стоимость ChatGPT Plus — $20 (1 788,92 по курсу ЦБ)
Нехватка вычислительных мощностей в наше время — явление не редкое. Дефицит графических процессоров связан с растущим спросом в таких областях, как искусственный интеллект, игровая индустрия и майнинг криптовалют. Кроме того, проблемы с поставками, вызванные нехваткой полупроводников, также способствуют возникновению дефицита GPU.
Дифицит GPU
В связи с ростом популярности нейросетей наблюдается значительный спрос на специализированное оборудование, в частности на графические процессоры. Что создает серьезное давление на цепочки поставок.
TSMC, ведущая компания в области производства полупроводников, предупредила о сохраняющемся дефиците графических процессоров для ИИ. По прогнозам компании, дефицит может продлиться до 18 месяцев.
Марк Лю, председатель правления TSMC, связывает нехватку графических процессоров со взрывным ростом разработки генеративного искусственного интеллекта (GenAI), который требует значительных вычислительных ресурсов.
TSMC столкнулась с неожиданным дефицитом в производстве CoWoS — ключевого этапа в производстве графических процессоров для ИИ. Спрос на услуги по производству CoWoS вырос в три раза по сравнению с обычным уровнем.
Несмотря на планы TSMC удвоить свои производственные мощности к 2024 году, компания ожидает, что дефицит может сохраниться и в 2025 году.
В ответ на критическую ситуацию Nvidia начала диверсифицировать свою цепочку поставок. Компания заключила партнерские соглашения с Intel и Samsung для предоставления услуг по упаковке высокоскоростной памяти (HBM) и графических процессоров. Это стратегическое решение направлено на смягчение некоторых проблем в цепочке поставок, пока TSMC наращивает свои производственные мощности.
Стоит упомянуть и планы OpenAI над созданием специализированных микросхем для искусственного интеллекта, чтобы преодолеть дефицит графических процессоров. В рамках работы компания рассматривает возможность сотрудничества с производителями микросхем, например с Nvidia, а также изучает возможность приобретения компании-производителя микросхем.
Главный спонсор OpenAI, Microsoft, также участвует в разработке специализированных микросхем для искусственного интеллекта, чтобы снизить зависимость от внешних поставщиков. Однако разработка таких микросхем может занять некоторое время.
Новый GPT
На момент публикации этой статьи ChatGPT-4.5 является самой передовой моделью чат-бота у OpenAI. В новой версии модели реализованы дополнительные функции, которые позволяют эффективно выявлять закономерности, генерировать уникальные идеи и решать практические задачи, такие как создание текстов, программирование и анализ данных.
Модель была обучена на суперкомпьютерах Microsoft Azure AI, что обеспечило ей глубокие знания и надежность. Благодаря новым методам обучения, ChatGPT-4.5 лучше понимает намерения пользователей и демонстрирует более высокий уровень эмоционального интеллекта. Это делает ее полезной для широкого спектра задач, включая творческое письмо, дизайн и многоэтапное планирование.
Это «масштабная и дорогостоящая модель», как описал ее Сэм Альтман. Подключение к ней обойдется в $75 за 1 миллион входных токенов и $150 за 1 миллион выходных. Для сравнения, у GPT-4o эти тарифы составляют $2,50 и $10 соответственно.
Несмотря на высокую стоимость, это «не анализирующая модель, и она не превзойдет показатели эталонной модели», — признался генеральный директор OpenAI. Однако, по его словам, «это другой тип интеллекта, в нем есть магия, которую я раньше не ощущал».