На проходящей в Денвере конференции SC’13 компания Nvidia представила новый ускоритель Tesla K40. Он был назван самым быстрым в мире векторным сопроцессором в формате карты расширения с интерфейсом PCI Express 3.0 x16.

Сегодня 53 из 500 самых быстрых суперкомпьютеров в мире используют графические ускорители, и их доля растёт с каждым годом. Генеральный директор подразделения Nvidia Tesla Сумит Гупта (Sumit Gupta) так прокомментировал эту тенденцию в ходе своего выступления:

“Графические ускорители стали ключевым направлением в сфере высокопроизводительных вычислений и суперкомпьютерной индустрии. Они помогают создавать инновационные решения и выполнять научные исследования. С выдающейся производительностью и объёмами памяти Tesla K40 крупные предприятия смогут быстрее обрабатывать большие объёмы данных, которые постоянно загружаются в их аналитические системы”.

Ускоритель K40 основан на прежней архитектуре Nvidia Kepler. Он получил слегка обновлённый чип GK110B, число потоковых процессоров в котором увеличено с 2 688 до 2 880. Подобный графический чип GK110 устанавливается в видеокарты GeForce GTX 780 Ti.

По сравнению с K20X новая модель обеспечивает небольшой прирост теоретической пиковой производительности. При вычислениях с плавающей запятой она ограничена пределом 4,29 терафлопс (одинарная точность) и 1,43 терафлопс (двойная точность). Напомним, что у K20X эти показатели были на уровне 3,95 и 1,31 терафлопс соответственно.

Сравнение скорости Nvidia Tesla K20X и K40 (изображение: chiphell.com)
Сравнение скорости Nvidia Tesla K20X и K40 (изображение: chiphell.com).

Однако от своего предшественника модель K40 отличается ещё и удвоенным объёмом памяти – двенадцать гигабайт вместо шести. Причём это самая быстрая память стандарта GDDR5, модули которой подключены к шестиканальному контроллеру. При эффективной частоте 6 ГГц подсистема памяти обладает пропускной способностью в 288 ГБ/с.

Это не только повышает реальную эффективность ускорителя при обработке больших объёмов данных на 20–40%, но и позволяет использовать его для работы с новыми категориями аналитических программ.

Сравнение скорости моделирования аэродинамического сопротивления в программе ANSYS FLUENT на двух процессорах Intel Xeon E5-2680 и двух ускорителях Nvidia Tesla K40 (изображение: videocardz.com)
Сравнение скорости моделирования аэродинамического сопротивления в программе ANSYS FLUENT на двух процессорах Intel Xeon E5-2680 и двух ускорителях Nvidia Tesla K40 (изображение: videocardz.com).

Как и прежде, технология NVIDIA GPU Boost обеспечивает снижение тепловыделения и оптимизацию потребления энергии. Расчётный показатель энергоэффективности составляет 19 гигафлопс на ватт. Сами ускорители поставляются без активного охлаждения, поскольку их дизайн учитывает обдув кулерами сервера.

После основной части выступления был сделан ряд заявлений о партнёрстве. Участникам конференции напомнили о том, что ещё в конце лета Nvidia вместе с рядом других компаний присоединилась к созданному по инициативе IBM и Google консорциуму OpenPOWER. Сейчас в нём на основе архитектуры IBM Power8 и ускорителей серии Tesla приступили к разработке серверов нового поколения для центров обработки данных и облачных сервисов.

Новым анонсом стала инициатива Вычислительного центра университета штата Техас в Остине. В нём планируется использовать Tesla K40 для развёртывания системы визуализации и анализа данных. Её рабочее название – Maverick, и она будет представлена уже в январе следующего года.

Руководитель данного направления Келли Гэйтэр (Kelly Gaither) так прокомментировал эту инициативу в пресс-релизе:

“Ускорители Nvidia Tesla K40 помогут исследователям получить новое понимание сложных процессов благодаря анализу больших объёмов данных и сложной визуализации. Maverick обеспечит мощные интерактивные возможности для решения самых сложных научных проблем”.

Помимо таких чисто научных областей, как физика, химия и генетика, ускорители Tesla используются для решения задач проектирования и анализа данных в приложениях электронной коммерции. Сегодня более двухсот сорока программ поддерживают вычисления на видеокартах и специализированных ускорителях схожей архитектуры.