Российская визуально-текстовая модель Alice AI VLM от компании «Яндекс» заняла вторую позицию в рейтинге бенчмарка MWS Vision Bench. Данный бенчмарк является первым русскоязычным инструментом для оценки бизнес-OCR и мультимодальных моделей, сфокусированным на реальных коммерческих задачах.

В ходе тестирования модель показала результаты выше, чем у ряда международных аналогов, включая Gemini 2.5 Flash (Google), GPT-4.1 mini (OpenAI) и Claude 4.5 Sonnet (Anthropic). Первое место в рейтинге заняла модель Gemini 2.5 Pro (Google).
MWS Vision Bench оценивает способности моделей к анализу изображений и текста, в том числе в сложных русскоязычных документах. Результаты, продемонстрированные Alice AI VLM, свидетельствуют о ее конкурентоспособности в данной области.
«Результаты MWS Vision Bench подтверждают, что российские модели перешли от экспериментальных наработок к реальной прикладной ценности. Alice AI VLM и другие визуально-языковые модели ускорят автоматизацию документооборота, снизят долю ручной правки и повысят качество данных в бизнес‑процессах. Для компаний это означает более быстрые решения, меньше ошибок и экономию в операционной работе — от банков и страховых компаний до логистики и госуслуг».
Павел Голосов, директор ИОН РАНХиГС
Ранее Яндекс представил новое семейство генеративных моделей Alice AI, в состав которого вошла и VLM-модель. Модель Alice AI VLM использует расширенный набор данных для обучения и поддерживает контекст до 32 тысяч токенов, что направлено на повышение точности работы с текстовой информацией на изображениях.