Kandinsky 6.0 Image научился реставрировать старые фото и примерять макияж

Компания Сбер запустила флагманскую модель генерации и редактирования изображений Kandinsky 6.0 Image. Нейросеть интегрирована в ИИ-помощника «ГигаЧат» и доступна бесплатно в веб-версии, мобильном приложении и мессенджерах без ограничений по количеству запросов.

По заявлению разработчиков, новая модель работает до двух раз быстрее предыдущей, лучше понимает сложные многосоставные инструкции и создает более детализированные изображения. Внутренние тесты показывают, что в ряде задач по редактированию Kandinsky 6.0 сопоставим с такими международными моделями, как Nano-Banana, Flux и Qwen.

Среди основных нововведений — реставрация старых и поврежденных фотографий, когда модель возвращает четкость выцветшим или поцарапанным снимкам, стилизация изображений под аниме, комиксы или мультипликацию, а также режим нейрофотосессии, позволяющий создавать серию новых кадров на основе одной фотографии с изменением фона, одежды или локации. Кроме того, пользователи могут примерить новый образ, сделать макияж, сменить прическу или добавить аксессуары, причем модель стала аккуратнее при точечных правках и реже допускает ошибки, известные как «галлюцинации». Текст на сгенерированных изображениях теперь отображается корректнее.

Еще одно важное улучшение — встроенный механизм поиска по изображениям, или Image RAG. Если модель не знает, как выглядит объект из запроса, например недавно появившийся популярный персонаж, она находит нужный визуальный референс. Это позволяет генерировать точные изображения даже тех объектов, которые возникли уже после завершения обучения модели.

В основе Kandinsky 6.0 Image лежит архитектура Mixture of Experts (MoE). Вместо того чтобы задействовать всю нейросеть на каждый запрос, система автоматически выбирает специализированные блоки, отвечающие за конкретные задачи, что ускоряет работу и упрощает дальнейшее улучшение модели. По данным Сбера, пользователи «ГигаЧата» уже создали несколько сотен миллионов изображений с помощью предыдущих версий.

Сфера применения обновленного инструмента включает быстрое редактирование фотографий, реставрацию старых снимков, примерку образов, создание визуала для соцсетей и иллюстраций с постоянными персонажами, рекламные макеты, подбор фонов, визуализацию интерьеров и отделки, а также формирование карточек товаров и рекламных изображений без использования фотостудии. Сгенерированные изображения можно сразу использовать для создания видео через модель Kandinsky Video, также доступную в «ГигаЧат». В ближайшее время компания обещает расширить возможности работы с видеоконтентом.

Подписывайтесь на наш Telegram Подписаться