Российские ученые представили на EACL 2026 инструменты, которые сделают ИИ точнее и прозрачнее

В Рабате (Марокко) проходит международная конференция по компьютерной лингвистике EACL 2026, где исследователи Сбера из команды SberAI совместно с коллегами из ведущих российских технологических компаний, российских и зарубежных вузов представили серию научных работ, направленных на повышение точности, прозрачности и безопасности ИИ.

Главная новость для разработчиков нейросетей с учетом русского языка — появление первого в России мультимодального бенчмарка MERA Multi. Работа Multimodal Evaluation of Russian-language Architectures решает проблему отсутствия методов оценки ИИ в доменах изображений, видео и аудио, учитывающих культурные особенности страны. Созданный инструмент охватывает различные задачи анализа, а разработчики могут оценивать свои модели на открытой платформе с публичным лидербордом. Проект реализован Альянсом в сфере ИИ при участии Института AIRI, НИУ ВШЭ, Сколтеха, РТУ МИРЭА и Т-Технологий.

Еще одна разработка — первый динамический RAG-бенчмарк для русского языка DRAGOn, созданный на основе свежих новостей. Он решает проблему утечки данных, когда модель «запоминает» ответы из обучающей выборки вместо поиска в актуальном контексте. Система автоматически формирует граф знаний, строит вопросно-ответные пары и исключает человеческий фактор из процесса проверки. Фреймворк для парсинга и генерации данных выложен в открытый доступ и может адаптироваться под научные статьи, посты и другие домены. Эксперименты подтвердили критическую важность качества поиска в RAG-системах — теперь у разработчиков есть надежный инструмент для его оценки. Статья подготовлена учеными Сбера, MWS AI (входит в МТС Web Services) и других организаций.

В работе From Standard Transformers to Modern LLMs ученые предложили обновленный курс по трансформерным моделям, включив в него темы, ранее остававшиеся за пределами университетских программ: RAG, автономные агенты, мультимодальные диалоговые модели. Курс дает практические навыки работы с ИИ-помощником ГигаЧат и знакомит с российскими бенчмарками MERA, DRAGOn и LIBRA, позволяя готовить специалистов, востребованных в индустрии. Авторы — исследователи Сбера совместно с учеными НИУ ВШЭ, Сколтеха и Института AIRI.

Работа команды SberAI посвящена безопасности данных. В статье FiMMIA представлен модульный фреймворк, детектирующий утечки данных в мультимодальных больших языковых моделях. Метод генерирует для каждого примера семантически близкие варианты («соседей»), вычисляет разницу в эмбеддингах и лоссах, после чего нейросеть предсказывает факт утечки. Подход масштабируется на изображения, видео и аудио, что делает его универсальным инструментом для контроля чистоты обучающих выборок.

Подписывайтесь на наш Telegram Подписаться