Нейросеть A-Vibe от Авито признана лучшей легкой ИИ-моделью для русского языка

Нейросеть A-Vibe разработки Авито заняла первое место среди легких языковых моделей (до 10 млрд параметров) в российском бенчмарке MERA, обойдя зарубежные аналоги от OpenAI, Google и Anthropic.

Ключевые преимущества A-Vibe включают на 25% лучшую генерацию кода по сравнению с Gemini 1.5, на 32% более точное ведение диалогов, чем у Llama 3.1, и на 23% более глубокий анализ текста в сравнении с Claude 3.5 Haiku.

«Именно обучение небольшой модели под наши нужды позволяет нам закладывать окупаемость инвестиций: Авито планирует вложить в GenAI около 12 млрд рублей, а заработать более 21 млрд рублей к 2028 году».

Андрей Рыбинцев, старший директор по данным и аналитике Авито

Разработчики Авито модифицировали исходную модель, создав специальный токенизатор для русского языка, что ускорило обработку русскоязычных текстов в 2 раза и значительно улучшило качество генерации. Модель поддерживает до 32 000 токенов, позволяя эффективно работать с объемными текстами.

A-Vibe уже применяется в сервисах Авито, помогая продавцам создавать эффективные описания товаров и ускорять коммуникацию в мессенджере. Компания планирует до конца года внедрить еще 20 сценариев использования и рассматривает возможность открытия кода модели для разработчиков.

«Мы рассматриваем возможность выпуска модели в открытый доступ, что станет нашим вкладом в развитие российского рынка ИИ. Это поможет малому бизнесу внедрять передовые технологии без значительных инвестиций, образовательным учреждениям создавать прикладные программы, а независимым разработчикам строить современные сервисы на базе отечественных технологий. Для нас это возможность получить ценную обратную связь от рынка и улучшить наши модели».

Анастасия Рысьмятова, руководитель разработки больших языковых моделей «Авито»

Бенчмарк MERA, разработанный при поддержке Альянса ИИ, является российским стандартом оценки языковых моделей с акцентом на понимание русского языка и культурного контекста.

Что будем искать? Например,ChatGPT

Мы в социальных сетях