Технологическая платформа «Авито» выпустила в открытый доступ свои генеративные модели, став первым российским разработчиком open-source решений, обученных на данных электронной коммерции с оптимизацией под русский язык.

Технологическая платформа «Авито» открыла исходный код своих генеративных моделей — A-Vibe и A-Vision. Объем одной из моделей составляет 8 миллиардов параметров. Данные решения стали первыми российскими открытыми моделями, которые были обучены на данных электронной коммерции и специально адаптированы для работы с русским языком. Благодаря этой адаптации скорость генерации текста увеличивается примерно в два раза.
На тестовых испытаниях, таких как MERA и RU Arena Hard, модель A-Vibe продемонстрировала наилучшие результаты в своем классе. Она показала более высокую эффективность по сравнению с такими крупными нейросетевыми архитектурами, как GPT-4o mini, Gemma 3 27B и Claude 3.5 Haiku.
Модели созданы на базе архитектур Qwen 3 и Qwen 2.5-VL. В них интегрирован собственный токенизатор, оптимизированный для русского языка, а также реализована поддержка function calling. Эта функция позволяет подключать к модели внешние инструменты, что необходимо для создания сложных ИИ-агентов.
«Открытие наших генеративных ИИ-моделей — это инвестиция в будущее российской технологической экосистемы. Благодаря таким инициативам ИИ становится доступным не только корпорациям, но и студентам, стартапам, исследователям и небольшим командам. Чем больше разработчиков вовлечено в создание ИИ-решений, тем быстрее развивается вся отрасль. Мы хотим внести свой вклад в этот процесс».
Андрей Рыбинцев, управляющий директор по искусственному интеллекту «Авито»
Бизнес может использовать модели для автоматизации документооборота, генерации контента и создания клиентских чат-ботов. Разработчики получают возможность дообучать и развертывать модели для решения собственных задач без значительных затрат. В сфере образования и науки эти модели могут служить инструментом для проведения экспериментов и исследований.
«Рынок остро нуждается в качественных русскоязычных моделях с открытым кодом. Компании тратят месяцы на адаптацию зарубежных решений под российские реалии. Мы даем готовые инструменты, которые экономят миллионы рублей на разработке. Наши модели компактны и оптимизированы для эффективного использования ресурсов, что особенно важно для стартапов и образовательных инициатив».
Анастасия Рысьмятова, руководитель разработки больших языковых моделей «Авито»
Для объективной оценки возможностей русскоязычных моделей команда Авито адаптировала четыре международных бенчмарка — MATH-500, GPQA Diamond, DROP_RU и BFCL V3. Эти методики оценки также были опубликованы в открытом доступе.
