Новый список пятисот самых мощных компьютеров в мире был представлен на проходящей в Новом Орлеане конференции по суперкомпьютерным вычислениям SC’14. Суммарная мощность всех высокопроизводительных систем превысила 309 петафлопс, что почти на четверть выше прошлогоднего результата.

В четвёртый раз подряд рейтинг возглавляет система Tianhe-2, разработанная в Китайском Национальном университете оборонных технологий. Архитектура и особенности создания этого суперкомпьютера рассматривались на страницах «Компьютерры» в прошлом году.

Суперкомпьютер Тяньхэ-2 (фото: mil.cnr.cn).
Суперкомпьютер Тяньхэ-2 (фото: mil.cnr.cn).

За прошедшее время США не смогли вернуть пальму первенства в области разработки высокопроизводительных компьютерных систем, которую ранее удерживали безраздельно. Реванш взять вновь не удалось, хотя вычислительная мощность главного конкурента осталась без изменений. Tianhe-2 по-прежнему демонстрирует 33,86 петафлопс (квадриллионов вычислений в секунду) в тесте Linpack.

Расстановка первых девяти номинантов не изменилась, а вот десятая позиция выглядит немного загадочно. На ней оказался новый суперкомпьютер Cray CS-Storm, место расположения которого не указывается. Известно только, что он был разработан по заказу американского правительства.

Его основой стали процессоры Intel Xeon E5-2660v2, каждый из которых содержит десять двухпоточных ядер (двадцать логических). Однако в десятку лучших этот суперкомпьютер привели не чипы архитектуры x86-64, а векторные ускорители Nvidia Tesla K40 с ядром GK110B (Kepler). Именно они обеспечивают львиную долю его производительности. Все вычислительные узлы соединяются по высокоскоростной шине Infiniband FDR, что позволяет быстро перераспределять нагрузку.

Суперкомпьютер Cray CS-Storm (изображение: сray.com).
Суперкомпьютер Cray CS-Storm (изображение: сray.com).

Прежний лидер (Titan, Cray XK7) тоже использовал ускорители Nvidia, но более простые (по сегодняшним меркам) – Tesla K20.

В Китае решили сделать ставку на ускорители с другой архитектурой, и не прогадали. Представленный два года назад Tianhe-2 был оснащён сопроцессорами Intel Xeon Phi 31S1P. Он практически вдвое превзошёл Titan во всех тестовых заданиях. Китайский триумф стал настолько ошеломительным, что первенство этой системы среди суперкомпьютеров до сих пор не может оспорить ни одна страна.

Справедливости ради отметим, что суммарная производительность всех суперкомпьютеров в стране пока ещё остаётся самой высокой в США. Однако число мощных американских систем продолжает падать. Год назад их было больше половины во всём списке – 265. За первую половину года их осталось уже 233, а с последним обновлением рейтинга выбыли ещё два суперкомпьютера. Такими темпами США приблизится к историческому минимуму уже в следующем году.

Сопроцессоры Intel Xeon Phi 31S1P в суперкомпьютере Tianhe-2 (фото: netlib.org).
Сопроцессоры Intel Xeon Phi 31S1P в суперкомпьютере Tianhe-2 (фото: netlib.org).

Несмотря на внушительные результаты Tianhe-2, общее число суперкомпьютеров Китая также снижается. Из новой версии рейтинга исчезли пятнадцать китайских систем, а остались только шестьдесят одна. В остальной части азиатского региона также отмечается спад: общее число высокопроизводительных систем снизилось в нём за полгода на двенадцать суперкомпьютеров. Осталось только сто двадцать мощных систем на весь регион.

Святое место не бывает пустым: освобождающиеся строчки рейтинга TOP500 активно занимает Европа и Япония. Число высокопроизводительных европейских систем выросло на четырнадцать и составило сто тридцать суперкомпьютеров. В Японии прибавилось два новых: Magnolia (#174) и HELIOS (#265). Теперь Япония обладает тридцатью двумя мощными системами.

Бразилия утрачивает и без того невысокие позиции в сфере высокопроизводительных вычислений: в списке TOP500 осталось всего четыре бразильских суперкомпьютера, и ни один из них не входит даже в первую сотню. Чуть лучше дела у Канады — из шести мощных систем пять занимают позиции между второй и третьей сотней. Лидирует суперкомпьютер Торонтского университета BlueGene/Q с процессорами IBM PowerPC (#74).

Канадский суперкомпьютер архитектуры IBM BlueGene/Q (фото: labcanada.com).
Канадский суперкомпьютер архитектуры IBM BlueGene/Q (фото: labcanada.com).

Австралия постепенно начинает играть заметную роль: на её долю теперь приходится девять суперкомпьютеров. Самый мощный из них — Magnus (Cray XC40) на базе двенадцатиядерных процессоров Xeon E5-2690v3 с поддержкой Hyper-Threading (#41).

Российских суперкомпьютеров в новом списке также всего девять. Главный из них – кластер A-Class, созданный компанией «Т-Платформы» для Научно-исследовательского вычислительного центра МГУ. Впервые в рейтинге TOP500 он появился в июне этого года, а сейчас занимает в нём двадцать второе место.

Другой знаменитый суперкомпьютер «Ломоносов», также разработанный компанией «Т-Платформы» для МГУ, переместился на пятьдесят восьмое место, уступив за полгода шестнадцать позиций.

Новый суперкомпьютер появился в Санкт-Петербургском государственном политехническом университете. Это кластер архитектуры «РСК Торнадо», созданный группой компаний РСК. Он занял восемьдесят первую строчку в списке TOP500. Ещё один суперкомпьютер СПбГПУ RSC PetaStream переместился на позицию #390.

Российский суперкомпьютер RSC PetaStream. Каждый шкаф содержит 1024 узла с прямым жидкостным охлаждением (фото: rscgroup.ru).
Российский суперкомпьютер RSC PetaStream. Каждый шкаф содержит 1024 узла с прямым жидкостным охлаждением (фото: rscgroup.ru).

Остальные шесть российских систем вышли за пределы первой сотни. Кластер МВС-10П (#133) МСЦ РАН ещё полтора года назад был вторым среди самых мощных суперкомпьютеров на территории России и СНГ. Кластер «Лобачевский» (#189) и модернизированный «РСК Торнадо ЮУрГУ» (#190) завершают перечень отечественных суперкомпьютеров для научных исследований.

Гибридный кластер «Лобачевский» был установлен в НОЦ «СКТ-Приволжье» Нижегородского государственного университета имени Н. И. Лобачевского компанией «Ниагара Компьютерс». Его отдельные сегменты подобны модулям суперкомпьютеров «Титан» и «Тяньхэ-2». В первом сегменте кластера используются как сопроцессоры Intel Xeon Phi 5110P, так и ускорители Nvidia Tesla K20x. Во втором вместо них установлены графические процессоры NVIDIA Tesla M2090. Всего оба сегмента кластера объединяют сто шестьдесят гибридных вычислительных узлов. Текущий рейтинг TOP500 учитывает данные о скорости вычислений только на девяноста однородных узлах, снятые совместно со специалистами Nvidia. Каждый такой узел содержит два восьмиядерных процессора Intel Xeon E5-2660 с поддержкой Hyper-Threading и три векторных ускорителя Nvidia Tesla K20x. Пиковая производительность гибридного кластера составляет 550 терафлопс. В официальный зачёт пошли результаты теста Linpack, показавшие среднее значение 289,5 терафлопс.

Кластер «РСК Торнадо ЮУрГУ» был разработан для Южно-уральского государственного университета. Система на базе Intel Xeon Phi SE10X пришла на смену работающему с июня 2008 года суперкомпьютеру «СКИФ-Аврора», чья производительность в сто терафлопс уже выходит за рамки TOP500.

Российский суперкомпьютер "РСК Торнадо ЮУрГУ" (фото: rscgroup.ru).
Российский суперкомпьютер «РСК Торнадо ЮУрГУ» (фото: rscgroup.ru).

Замыкают общий список российских суперкомпьютеров два специализированных сервера для коммерческого использования. Это двухсокетные блейд-серверы HP ProLiant BL460c Gen8. Модель на базе Intel Xeon E5-2680v2 занимает позицию #337, а система на основе восьмиядерных Xeon E5-2660 оказалась почти в самом конце рейтинга (#457).

С момента первой публикации в июне 1993 года, список TOP500 служил общепринятой мерой производительности суперкомпьютеров. Самые мощные вычислительные системы со всего мира тестировались в Linpack и ранжировались в соответствии с полученными результатами. В последние два года наметился общий спад: темпы прироста средней производительности неуклонно снижаются от списка к списку.

Стагнация в первой десятке резко контрастирует с постоянной сменой позиций в средней и особенно финальной части списка. Это может восприниматься как признак переориентирования производителей на сегмент малых суперкомпьютерных систем и как временное достижение рационального предела в наращивании мощности отдельных кластеров.