Хуанг, где ROPs или Nvidia продает недоделанные видеокарты

Катастрофа, разворачивающаяся вокруг релиза новых видеокарт Nvidia, продолжает набирать обороты, и с каждым днем ситуация становится все ближе к тому, чтобы стать наихудшим запуском нового поколения GPU.

Даже 20-я серия Nvidia RTX с артефактами памяти и дикими ценами наряду с AMD Radeon Vega и ее напрочь неработающими драйверами рискуют остаться в тени того, что происходит с 50-й серией. Теперь к плавящимся разъемам и кабелям, крайне слабому приросту производительности за поколение, отсутствию на полках магазинов, невероятным ценам у перекупщиков и некорректно работающим драйверам добавилась новая проблема — недостающее количество ROPs. Подробнее об этом — в статье.

К плавящимся разъемам и кабелям, крайне слабому приросту производительности за поколение, отсутствию на полках магазинов, невероятным ценам у перекупщиков и некорректно работающим драйверам добавилась новая проблема — недостающее количество ROPs. Подробнее об этом — в статье.

Что такое ROP

Аббревиатура ROP означает Raster Operations Pipeline или конвейер растровых операций. В свою очередь он состоит из блоков ROPs, а это физические компоненты в GPU, и они же — одни из ключевых в видеокарте. Плюс к тому они представляют собой одну из последних стадий обработки данных в видеокарте: ту, после которой формируется цифровой сигнал, подаваемый на монитор. От того, сколько ROP в карте, зависит ее значение Fill Rate — это скорость заполнения пикселями. Вдобавок к этому ROPs играют ключевую роль при аппаратном сглаживании, так как оно выполняется именно на них. Таким образом, если говорить очень упрощенно и кратко — чем больше ROPs, тем быстрее GPU.

Пропажа ROPs

Вскоре после релиза новых видеокарт 50-й серии в сети стали появляться сообщения о том, что у некоторых купивших свежие GPU количество ROPs не соответствует заявленным. Это отчетливо видно на скриншотах информационной утилиты GPU-Z: у RTX 5090 вместо положенных по паспорту 176 ROPs присутствуют только 168. 

Помимо RTX 5090, проблеме подвержены: 5090D, 5070 Ti, и это официальное заявление Nvidia. В нем же сказано, что отсутствующие ROPs ведут к потере 4% производительности, однако не сказываются на скорости выполнения ИИ-вычислений. Однако выяснилось, что картина масштабнее. Один из зрителей YouTube-канала Gamers Nexus заявил, что в его RTX 5080 только 104 ROPs — на восемь меньше, чем должно быть, что вступает в прямое противоречие с тезисом чипмейкера. 

Безусловно, не все выпущенные карты дефектные: всё зависит от конкретного батча, но вот с вендорами ситуация хуже, так как почти все из них оказались в листе проблемных: ASUS, Gigabyte, Manli, MSI, Zotac, Palit, Nvidia.

Как можно «потерять» ROPs

На изображении ниже — чип Nvidia GB202, на котором построена RTX 5090. Кристалл содержит в себе 12 GPCs (Graphics Processing Clusters или кластеров обработки графики), каждый из них вмещает в себя восемь TPCs (Texture Processing Clusters или кластеров обработки текстур), а в одном отдельно взятом TPC — по два SM (Streaming Multi Processors или потоковых мультипроцессора). 

Но есть несостыковка: у RTX 5090 не 96 TPCs, а только 85. Связано это с нюансами производства процессорных кристаллов. Это дорого, и поэтому чипмейкеры просто не могут позволить себе выкидывать дефектные образцы в мусорное ведро. Вместо этого прибегают к технологии «отбраковки» или «биннинга» (binning).

С ее помощью дефектный кристалл, который не годится для производства флагманского устройства, все еще оказывается полезен. В нем просто отключаются нерабочие блоки. Таким образом, например, Intel из нерабочего восьмиядерного чипа может сделать годящийся в продажу шестиядерный и так далее.

В случае с Nvidia принцип тот же — 11 блоков TPC — это запас, который компания берет для подстраховки при производстве, и кристаллы со всеми 96 TPCs в дальнейшем могут стать основой для условной RTX 5090 Ti или Super. Те чипы, у которых поврежден хотя бы один блок TPC, берутся для RTX 5090, а оставшиеся 10 рабочих банально отключаются.

Причины «потери» ROPs

Взглянем на увеличенную часть диаграммы чипа GB202 еще раз. Если обратить внимание на блок GPC, то можно заметить синюю полосу снизу, разбитую на восемь частей — это ROPs. Их две группы по восемь в одной, и каждая из таких относится к четырем блокам TPCs.

Исходя из этого, можно предположить, что проблема с ROPs произошла от того, что в Nvidia по ошибке отключили слишком много соседних TPCs, а это привело к потере доступа к ROPs. Это чистая спекуляция, поскольку официального объяснения нет, однако менее логичной от этого догадка не становится.

Ошибка или хитрый план

Отключение блоков кристалла, или «биннинг», — нормальная и повсеместно распространенная практика. Неясно одно: каким образом вышло так, что карты мало того что не соответствуют заявленным характеристикам, но и появились на полках магазинов в таком виде.

На каждой производственной линии обязан присутствовать программно-аппаратный проверочный комплекс, моментально определяющий подобные вещи. Следовательно, либо в Nvidia работают некомпетентные сотрудники, не заметившие производственного изъяна, либо это было намеренное решение выпустить GPU именно такими и надеяться, что большой шумихи не будет.

Так или иначе, Nvidia стремительно теряет доверие, что, в свою очередь, может привести к изменению баланса сил на рынке, ведь «зеленых» выбирают потому, что их продукция стабильно и предсказуемо работает, в отличие от изделий «красной» AMD с исторически проблемными драйверами. Теперь парадигма изменилась, а значит, у AMD есть реальные шансы пошатнуть позиции Nvidia на рынке, ведь основного козыря в ее рукаве больше нет.

Успех операции с кодом «красный» будет зависеть от ценовой политики AMD. Если компания не будет жадничать, то победа, пусть и маленькая, не за горами, а Nvidia нужно срочно решать проблемы и, видимо, демпинговать прайс на свою свежую серию ускорителей.

Что будем искать? Например,ChatGPT

Мы в социальных сетях