Сбер представил в открытом доступе две собственные модели искусственного интеллекта — Kandinsky Video Lite для генерации видео по текстовому запросу и Giga-Embeddings для работы с векторными представлениями текста.

Сбер выложил в открытый доступ две собственные модели искусственного интеллекта. Речь идет об обновленной модели для создания векторных представлений текста Giga-Embeddings и модели для генерации видео Kandinsky Video Lite. Обе модели распространяются по открытой лицензии, что допускает их свободное использование в коммерческих проектах любого масштаба.
«Предоставление бизнесу и разработчикам новых мощных инструментов, как Kandinsky Video Lite и Giga-Embeddings, способствует ускорению темпов исследований, развитию инновационных продуктов и сервисов мирового уровня. Это демонстрирует наше стремление внести ощутимый вклад в развитие международного open-source сообщества. Кроме того, это важный этап становления стандартов в сфере обработки естественного языка (NLP), а также укрепление позиций России как технологического лидера на мировой арене».
Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка
Kandinsky Video Lite позволяет создавать короткие видео длительностью до 10 секунд на основе текстового запроса. Это компактная модель, содержащая два миллиарда параметров. По данным внутренних тестов, она превосходит по общему качеству, включая следование запросу, визуал и динамику, более крупные модели. Также представлена ускоренная версия Kandinsky Video Lite Flash, которая работает примерно в шесть раз быстрее базовой модели. Особое внимание при обучении модели уделялось пониманию отечественного культурного кода.
Второй продукт, модель Giga-Embeddings, преобразует текстовую информацию в векторные представления. Эта модель является лидером для русского языка в авторитетном benchmark ruMTEB, а также демонстрирует высокое качество работы с английским языком. Она предназначена для построения высокоэффективных RAG-систем, что повышает надежность и точность ответов искусственного интеллекта. Это дает корпоративному сектору инструмент для улучшения поиска по документам, аналитики данных и автоматизированной поддержки пользователей.
Модели доступны для свободного использования на ведущих платформах.
