Пару недель назад «Компьютерра» писала о новом поколении видеокарт Nvidia, анонсированном в начале января 2025 г. На тот момент были известны лишь официальные данные, предоставленные CEO компании Дженсеном Хуангом в рамках выставки CES 2025. Согласно им, новый флагман — RTX 5090 — до двух раз быстрее, чем топ предыдущего поколения — RTX 4090, однако потребительская аудитория, особенно та, что более-менее разбирается в «железе», в подобные чудеса верить отказалась.
Во-первых, это уж слишком высокий скачок производительности за поколение, учитывая прибавку количества транзисторов и CUDA-ядер вовсе не вдвое, а на 20 и 33% соответственно. Во-вторых, многих смутил демонстрационный слайд: на нем новинка, уходящая в отрыв от RTX 4090, использовала технологии генерации кадров DLSS 4.0, в то время как «старый» GPU ограничился DLSS 3.0. Напомним, третья версия DLSS генерирует один искусственный кадр в дополнение к одному реальному, в то время как четвертая итерация технологии способна добавлять к оригиналу уже до трех сгенерированных изображений кряду.
В итоге энтузиасты откинули маркетинг в сторону и попытались подсчитать реальную теоретическую производительность новой видеокарты самостоятельно. По их оценкам, прирост в сравнении с прошлой архитектурой должен был составить от 25 до 33%. Выясним, насколько был верен такой прогноз: появились первые результаты бенчмарков независимых экспертов, и о них — в этом материале.
Новая система охлаждения Double Flow Through
Новая серия RTX-видеокарт получила созданную с нуля систему охлаждения. В ее основе — испарительная камера со специально спроектированными испаряющими «колоннами» разной длины и диаметра. От нее отходят тепловые трубки, а жар от кристалла отводит медная подошва, контактирующая с чипом через жидкий металл. Его утечки исключены за счет тройной резиновой защиты.
Продувается вся система двумя вентиляторами, которые гонят воздух сквозь радиаторную решетку. Интересно то, что в ней сделаны углубления. Они нужны для повышения эффективности обдува: ближе к центру своей оси вентилятор не столь эффективен, как по краям — впадины сделаны с учетом этого и обеспечивают равномерное давление воздуха на всей площади радиатора.
Система сложная, но при всем этом карта легко разбирается, а главное — занимает всего два слота в системе. Это выдающееся достижение, поскольку предыдущая RTX 4080 занимала четыре таких, и это при тепловыделении на 125 Вт ниже.
Температуры и шум
С учетом колоссального тепловыделения — 575 Вт — и небольших габаритов карты, она вышла не горячей, во всяком случае, если говорить о температуре графического чипа. В стресс-тестах вентиляторы разгоняются до 1570 об/мин., а GPU прогревается до 72°, и это немного, особенно если учесть, что речь идет именно о пиковой нагрузке.
Что касается памяти, то она работает в допустимом диапазоне TJMax, но нагрев приличный: 89–90°. Владельцам небольших корпусов стоит тщательно обдумать, как организовать охлаждение так, чтобы температура не поднималась еще выше.
О шуме. Система охлаждения работает очень тихо: в пределах 33 дБ. Характер шума напоминает работу корпусных вентиляторов высокого качества, например, от Noctua с типоразмером 140 мм. При таком невысоком шумовом пороге графический чип работает на высоких частотах: в диапазоне от 2600 до 2700 МГц. Это выше официально заявленных 2400 МГц.
Производительность в играх
Энергопотребление
Энергопотребление карты в простое существенное — 46 Вт. Под простоем имеется в виду рабочий стол операционной системы Windows 11.
В игровых бенчмарках GPU потребляет в среднем 535 Вт с редкими скачками вплоть до 580–590 Вт. Отметим, что речь идет о потреблении самой по себе видеокарты, так как остальные компоненты системы: процессор, диски, оперативная память не учитываются. Результаты получены при схеме энергопотребления «высокая производительность».
Зависимость производительности от поколения PCIe
Несмотря на внушающую производительность новой карты, владельцам более старых систем можно не беспокоиться относительно поколения разъема PCIe на своей материнской плате. Разница между PCIe 3.0 x16 и PCIe 5.0 x16 составляет от 1 до 4%.
А вот требования к процессору, наоборот, высоки, и особенно сильно это проявляется в разрешении ниже 4K. В пару к RTX 5090 стоит подбирать что-то из лиги AMD Ryzen 7 7800X3D, а лучше AMD Ryzen 7 9800X3D. В противном случае в процессорозависимых играх GPU покажет меньшие результаты, чем мог бы.
DLSS 4.0 и MFG
Вместе с новым поколением видеокарт Nvidia представила обновленный пакет технологий под общим названием DLSS 4.0. Ключевое отличие — переход от сверточных нейронных сетей для ИИ-апскейлинга на архитектуру «трансформер», разработанную в Google.
Она основана на «механизме внимания» без использования рекуррентных нейросетей, и ее основное преимущество — в эффективности при высокой параллелизации. А значит, это идеальный вариант для работы на GPU.
По заверениям Nvidia, модель-трансформер дает более четкую картинку и меньшее количество видимых артефактов в сравнении с технологиями апскейлинга в пакете DLSS 3.0, где используется сверточная модель.
На практике имеем следующее: мелкие детали в играх, такие как заборы, кабели и мусор на земле, действительно прорисованы лучше. Плюс к этому DLSS 4.0 значимо превосходит DLSS 3.0 в сценах с резкими перепадами света и тени, что сильно заметно в Cyberpunk 2077.
Однако артефакты все еще без труда заметны в кадрах с прозрачными поверхностями и насыщенной анимацией. Они отличаются от тех, что попадались при включении DLSS 3.0, но точно так же легко заметны.
Нововведения в DLSS 4.0 касаются не только программной части, но и аппаратной. В картах 40-й серии использовались ускорители оптического потока — это отдельные блоки GPU, которые генерировали кадры, вставляя их между теми, что прорисовывались нативно: без использования ИИ. Этот подход приемлем, но не сверхэффективен, потому как серьезно нагружал вычислительные блоки карты, из-за чего снижалась базовая кадровая частота — та, к которой генератор должен был добавить искусственно созданные изображения. В результате этого при включении DLSS фреймрейт не рос прямо пропорционально.
В GPU 50-й серии вместо «железного» блока-ускорителя оптического потока используется более «легковесное» решение: за оптический поток отвечает модель ИИ, которая работает на мощностях CUDA и тензорных ядер. В итоге на создание одного кадра уходит на 40% меньше времени и еще на 30% — видеопамяти. Вдобавок ко всему Multi Frame Generation может создавать не один, а три кадра кряду, что позволяет достичь запредельных значений fps в той же Cyberpunk 2077.
Однако включение MFG ведет к дополнительным артефактам: двоящимся лопастям вентиляторов у кондиционеров в CP 2077, мерцающей разметке дорожного полотна в ней же, ореолу вокруг персонажа в Alan Wake 2.
Отдельно — про задержку. На удивление, включение MFG не только не увеличивает ее, но каким-то образом немного, но снижает ее. Разумеется, для этого нужно включить технологию Reflex 2.0.
Выводы
Увлеченные энтузиасты и скептики оказались правы: реальный прирост производительности не имеет ничего общего с обещаниями Дженсена Хуанга. Никакого двукратного отрыва нет: действительные цифры — в районе 30% в 4K относительно RTX 4090 и 20% в 2K в сравнении с ней же. Самый высокий зафиксированный результат — 40%, но это исключение из правил.
Так или иначе, на сегодняшний день RTX 5090 — это самое производительное решение на рынке без реальных конкурентов как таковых, но стоит ли переходить на него с уже имеющейся RTX 4090 — вопрос, на который каждый должен ответить для себя сам.