В Ливерморской национальной лаборатории была установлена платформа высокопроизводительных вычислений Catalyst, созданная совместно с Intel и Cray на основе кластера Cray CS300. С её помощью разные группы исследователей будут решать проблему обработки больших объёмов данных в современной науке.

Руководитель отдела перспективных технологических проектов Ливерморской лаборатории Мэтт Лайнингер (Matt Leininger) отмечает исключительную важность этой совместной инициативы:

“Партнёрство между Intel, Cray и Ливерморской лабораторией позволяет исследовать различные подходы к использованию большого количества быстрой энергонезависимой памяти в области высокопроизводительных вычислений, моделирования и анализа больших объёмов данных”.

Ресурсы кластера Cray CS300 будут распределены между тремя партнёрами с правами доступа соответственно уровню инвестиций. Доступ к системе будет контролироваться из центра высокопроизводительных вычислений Ливерморской лаборатории (HPCIC), созданным для совместной работы с промышленными партнерами и развития национальных программ США за счёт решений из области Big Data.

Платформа Catalyst на кластере Cray CS300 (фото: llnl.gov)
Платформа Catalyst на кластере Cray CS300 (фото: llnl.gov).

Кластер состоит из двух масштабируемых модулей (SUs – scalable units), представляющих собой апгрейд прежней архитектуры Tri-Lab Linux Capacity Cluster (TLCC-2). Последняя была создана компанией Appro, которую год назад купила Cray.

Кластер включает в себя 7 776 ядер, объединённых в 324 узла. Каждый узел представлен двумя двенадцатиядерными процессорами Intel Xeon E5-2 695v2, 128 ГБ оперативной и 800 ГБ энергонезависимой памяти. Дополнительно объём последней может быть увеличен за счёт подключения твердотельных накопителей (SSD) Intel с интерфейсом PCIe. Общая производительность Cray CS300 оценивается в 150 терафлопс.

Вице-президент Intel и генеральный менеджер группы технических вычислений Радж Хазра (Raj Hazra) считает, что Catalyst сыграет важную роль в развитии всей области Big Data:

“Big Data открывает совершенно новый метод познания. Чтобы решить проблему перехода от накопления больших объёмов данных к получению ценных знаний из них, мы должны были создать эту уникальную систему. Оснащённая самым мощными процессорам Intel и твердотельными накопителями, Catalyst станет важным инструментом углублённого анализа, развития технологий и стимулирования инноваций в течение следующего десятилетия”.

Кластер под управлением Linux стал основой вычислительной мощности трёх крупнейших лабораторий, выполняющих в основном исследования в рамках стратегических проектов. Среди них упоминаются программы Национальной администрации по ядерной безопасности, Лос-Аламосской национальной лаборатории, исследовательских учреждений корпорации Sandia (тесно связанной с Lockheed Martin) и собственной лаборатории расширенного моделирования.

Среди приоритетных направлений указываются биоинформатика, бизнес-аналитика, технологии машинного обучения и задачи математической лингвистики – в частности обработка естественного языка.

Платформа Catalyst была установлена в конце октября и станет доступной для ограниченного использования уже в этом месяце. Общий доступ американским компаниям и исследовательским институтам планируется предоставлять с декабря.