Компания MWS AI выпустила мультимодальную языковую модель Cotype Light 3, предназначенную для встраивания в ИИ-агентов. Модель способна одновременно обрабатывать текст и визуальные данные — договоры, чертежи, изображения — в едином контексте, что позволяет использовать ее на стандартном корпоративном оборудовании без переключения между специализированными системами.

Модель содержит 9 миллиардов параметров. По заявлениям разработчика, на специализированных задачах она сопоставима по эффективности с более крупными аналогами, но требует меньше вычислительных ресурсов. Cotype Light 3 может работать на стандартном корпоративном оборудовании и быстрее адаптироваться под конкретную задачу. В компании отмечают, что это позволяет снизить инфраструктурные расходы и ускорить переход от пилотных проектов к промышленной эксплуатации.
В стандартной точности (FP16/BF16) модель занимает около 18 ГБ видеопамяти. Для инференса достаточно одного серверного ускорителя, например NVIDIA A100, A10, L4 или их аналогов. Разработчик также заявляет о полной совместимости моделей семейства Cotype с российскими программно-аппаратными комплексами, включая продукт «Скала^р Машина ИИ» группы Rubytech. Обучение моделей ведется на облачных мощностях MWS Cloud.
Согласно данным независимого бенчмарка MERA, Cotype Light 3 стала первой компактной моделью, вошедшей в тройку лидеров за всю историю рейтинга, с результатом 0,792 балла из 1,0. Этот показатель превышает результаты большинства моделей, работающих с русским языком, включая те, которые содержат более 100 миллиардов параметров. В задачах по математике и оценке знаний о мире (география, история, наука, культура) заявленная точность модели превышает 99%.
В MWS AI планируют расширять линейку моделей в течение года, выпуская версии с увеличенным числом параметров для высоконагруженных сценариев. Приоритетом разработки остаются задачи, актуальные для корпоративных внедрений.