Stability AI анонсировала запуск новой нейросети под названием StableCode, которая пишет код на разных языках программирования. В компании считают, что решение поможет программистам в их повседневной работе и будет полезно для освоения новых технологий.
Что известно
Сейчас в StableCode доступны несколько моделей, которые генерируют код. Базовую модель обучили на открытом наборе данных от BigCode, включающем в себя 6,4 ТБ исходного кода на 358 языках программирования. После этого базовую модель дополнительно обучили на популярных языках программирования, включая Python, Go, Java, JavaScript, C, C++ и Markdown.
Уже обученную базовую модель использовали для обучения модели, предназначенной для решения практических задач. Для этого использовали набор из 120 тыс. пар в формате код/ответ.
Почему это важно
У LLM есть три уровня: базовая модель, модель инструкций и модель с большим контекстом — до 16 тысяч токенов. Это гораздо больше, чем у конкурентов. На старте будут поддерживаться Python, Go, Java, JavaScript, C, markdown и C++. Модель сможет также объяснить уже существующий код и исправить баги. Ранняя версия доступна в Hugging Face.
В компании отмечают, что StableCode выдает самые большие фрагменты кода по сравнению с другими открытыми моделям. Так в окне ответа можно просматривать код, который сопоставим по длине с пятью файлами на языке Python. Именно поэтому одним из сценариев использования значится обучение. Пользователь может сразу получить развернутый ответ на свой вопрос.