Ускорители Intel Xeon Phi стали новой тенденцией в архитектуре суперкомпьютеров

На конференции SC’13 в Денвере вчера был опубликован новый список пятисот самых быстрых суперкомпьютеров в мире. Их суммарная мощность составляет 250 петафлопс, причём половину общей производительности обеспечивают первые семнадцать моделей.

По традиции рейтинг обновляется дважды в год — в июне и ноябре. За прошедшие полгода ещё пять суперкомпьютеров преодолели петафлопсный барьер, доведя их общее число до тридцати одного.

Доля решений Intel среди всех суперкомпьютеров составляет более восьмидесяти двух процентов. Теперь она растёт не только за счёт многоядерных процессоров традиционной архитектуры, но и за счёт ускорителей Xeon Phi. Их использование стало новой тенденцией: уже тринадцать систем из рейтинга Топ-500 применяют их вместо аналогичных векторных ускорителей Nvidia и AMD.

Самой мощной системой в Европе стала Cray XC30. Под кодовым названием Piz Daint она была установлена в Швейцарском национальном центре суперкомпьютерных вычислений.

Мы уже привыкли видеть на первых местах списка Топ-500 американские вычислительные системы. Они всегда были широко представлены в первой десятке, да и общее их число часто составляло около половины всего перечня.

В прошлом году наметились любопытные изменения в расстановке сил. Японию, стремительно догоняющую США, вдруг оттеснил на третье место Китай. Специалисты Национального суперкомпьютерного центра в Тяньцзине представили модель Tianhe-1A, состоящую из 14 336 процессоров Xeon X5670 и 7 168 векторных ускорителей Nvidia Tesla C2050.

С результатом 2,5 петафлопс Tianhe-1A занял тогда восьмое место по производительности и первое по энергоэффективности. В этом году июньский лист Топ-500 неожиданно возглавил его наследник Tianhe-2, созданный для Оборонного научно-технического университета Китая азиатской компанией Inspur, чья штаб-квартира расположена в Цзинане.

Впервые за долгое время США потеряли приоритет в области высокопроизводительных вычислений. Вдвойне удивляет, что за прошедшие полгода им так и не удалось его вернуть: Tianhe-2 продолжает занимать первую строчку рейтинга, хотя его мощность даже не наращивалась.

С китайского языка «Тяньхэ» переводится как «Млечный Путь». Вторая модель этой серии суперкомпьютеров содержит шестнадцать тысяч вычислительных узлов, в каждом из которых расположено по два процессора Intel Xeon E5-2692 и по три векторных сопроцессора Intel Xeon Phi 31S1P. На каждый процессор выделяется по 32 ГБ оперативной памяти стандарта DDR3 с коррекцией ошибок, а на каждый сопроцессор — по 8 ГБ памяти стандарта GDDR5. Суммарный объём всех модулей памяти составляет тысячу терабайт.

Отказ от ускорителей Nvidia в пользу Intel Xeon Phi был неслучаен. Хотя архитектура Intel MIC значительно уступает NVIDIA Kepler по теоретическим показателям производительности, объединять решения от одного разработчика гораздо проще.

Кроме того, для Xeon Phi можно написать более эффективный программный код. В нём нет необходимости выполнять типичные для CUDA промежуточные преобразования и нет эффекта резкого падения скорости при повышении точности вычислений с плавающей запятой. Поэтому реальные научные программы, запускаемые на Xeon Phi, часто требуют меньше ресурсов и энергии при сопоставимых временных затратах на их выполнение.

Красноречивее всего об это говорит непревзойдённый результат Tianhe-2 в тесте Linpack — 33,863 петафлопс. Рекордсмен прошлого года — американский суперкомпьютер Titan с ускорителями Nvidia K20x — отстаёт от него почти вдвое с результатом 17,59 петафлопс.

Как сообщается в официальном пресс-релизе университета НОАК, суперкомпьютер Tianhe-2 используется для решения задач из области материаловедения, метеорологии, астрофизики и биохимии. С учётом его военной «родословной» это звучит как откровенный сарказм.