Компания ByteDance представила новую модель ИИ для создания изображений по тексту — Seedream 5. Основные заявленные преимущества системы включают повышенную реалистичность и логическую согласованность генерируемых сцен, нативную поддержку разрешения 4K, а также способность корректно отображать текстовые элементы.

Seedream 5, новый генератор изображений от компании ByteDance, позиционируется как значительное обновление на рынке технологий преобразования текста в изображение. Модель заявляет о решении ключевых проблем, характерных для многих аналогов, таких как непоследовательная анатомия персонажей и неестественная детализация.
Одна из особенностей модели — «режим глубокого рассуждения», предназначенный для анализа и воспроизведения физических свойств объектов, пространственных отношений и логики сцен, что направлено на повышение правдоподобности результата. Система также поддерживает нативную генерацию изображений в разрешении 4K (3840×2160 пикселей), что обеспечивает высокую детализацию, потенциально востребованную в профессиональной сфере. Отдельное внимание разработчики уделяют способности модели корректно отображать текстовые элементы, что может быть полезно при создании рекламных материалов, упаковки или интерфейсов.
Разработчики отмечают, что система способна обрабатывать сложные запросы, включающие элементы промышленного дизайна или архитектурной визуализации. В основе этих возможностей лежит так называемый «режим глубокого рассуждения», который отвечает за многоэтапную интерпретацию пользовательских инструкций.