Специалисты T-Bank AI Research разработали новый метод обучения больших языковых моделей (LLM), который повышает точность и безопасность ответов ИИ на 15%. Технология улучшает качество работы ИИ по пяти ключевым параметрам, что делает его более надежным для бизнеса и обычных пользователей.
Одна из проблем современных языковых моделей — снижение качества при длительном обучении. Чтобы решить эту задачу, исследователи модифицировали метод оптимизации Trust Region. Вместо фиксированных начальных настроек модель теперь периодически обновляет опорные точки. Это происходит двумя способами: постепенными небольшими изменениями (мягкое обновление) или полным пересчетом параметров через определенные интервалы (жесткое обновление).
Тесты показали, что такой подход позволяет ИИ давать более точные и последовательные ответы. Например, в задачах по сокращению текстов качество результатов выросло на 10–15% по сравнению с традиционными методами. Модели лучше следуют инструкциям и реже допускают ошибки в сложных запросах.
Разработка может применяться в различных сферах, включая виртуальных ассистентов, образовательные и медицинские чат-боты. Основные преимущества метода — более высокая точность, связность и информативность ответов, а также снижение риска «переобучения» на ошибочных данных. При этом технология остается совместимой с существующими алгоритмами и не требует сложной интеграции.
«Наш новый подход позволяет сохранять баланс между способностями модели решать новую узкую задачу и общим пониманием картины мира, что открывает возможности для создания более гибких и адаптивных моделей. Это направление еще далеко не исчерпано — у ученых остается большое пространство для дальнейших исследований ИИ и улучшений, которые могут привести к новым прорывам в оптимизации языковых моделей и их применении в реальном мире».
Борис Шапошников, руководитель научной группы AI Alignment, лаборатория исследований искусственного интеллекта T-Bank AI Research
Новый подход позволяет компаниям повысить эффективность своих ИИ-решений, что может способствовать дальнейшему развитию технологий в этой области.