Распределённые вычисления: как собрать с миру по гигафлопсу на развитие науки

Вот уже более шестнадцати лет у каждого пользователя есть хорошая возможность внести посильный вклад в развитие науки. Не нужны денежные пожертвования и даже профессиональный интерес к выбранному предмету исследований. Имеет значение лишь то, какими чертами характера обладает человек и насколько современные компьютеры есть в его распоряжении. При удачном сочетании этих факторов появляются надёжные узлы сетей распределённых вычислений – одного из самых мощных инструментов компьютерной обработки данных.

Благодаря совместным усилиям обычных пользователей удалось сделать множество значимых открытий. Только за последние три года они отыскали 53 пульсара, причём последние семь нашлись совсем недавно — в конце августа 2012 г. Результаты выполненных исследований используются при разработке лекарственных препаратов для лечения сахарного диабета второго типа, болезней Альцгеймера и Паркинсона, других тяжёлых заболеваний. По материалам выполненных работ опубликованы сотни научных статей.

Суперкомпьютеры и распределённые сети

Мощные суперкомпьютеры – это капля в море. Машин, которые представляют собой предмет гордости целых стран и занимают первые строчки рейтинга TOP 500, не так уж много, и на всех их не хватает. Чтобы получить доступ к суперкомпьютеру, требуется сначала обосновать необходимость выбранной задачи, а потом, если доводы оказались убедительными, дождаться очереди и успеть оптимизировать код для выполнения на своеобразной суперкомпьютерной архитектуре.

Лидеры списка TOP 500 на ноябрь 2012 г.

Несмотря на внушительные значения пиковой производительности, требуемое время работы суперкомпьютеров может измеряться месяцами. Очевидно, что монополизировать ценную машину на столь долгий срок не позволят. К тому же организаций, которым по карману счета за сотни мегаватт-час, съедаемых вычислениями, прямо скажем, немного.

Решение этой проблемы существует. Поскольку многие научные задачи поддаются параллелизации, «объять необъятное» можно по частям — поделив их между энтузиастами.

Сети распределённых вычислений получили широкую известность в 1996 году в ходе командных соревнований по поиску чисел Мерсенна. Другим заметным проектом того времени стал SETI@home — коллективный поиск сигналов внеземных цивилизаций в данных, собранных с помощью радиотелескопов. Найти инопланетян так и не вышло, но этот опыт не был бесполезным. Он показал, что проекты таких масштабов могут успешно работать даже на добровольных началах. А наработки SETI@Home пригодились при подготовке исследовательских программ для поиска радиопульсаров.

Сегодня любому пользователю компьютера, работающего под управлением Windows, Linux или OS X, потребуется не больше десяти минут, чтобы присоединиться к одной из глобальных научных инициатив. Для этого в 2002 году Калифорнийским университетом в Беркли была разработана платформа с единым клиентским приложением BOINC Manager.

По состоянию на конец 2012 г. BOINC применяется в 87 открытых проектах распределённых вычислений (ещё 24 обходятся без него). Для удобства они разделены по научным дисциплинам, а их краткая характеристика доступна также и на русском языке.

Некоторые проекты распределённых вычислений на платформе BOINC

Общее количество участников на конец 2012 года составляет около 2,5 миллионов. При этом число компьютеров, ведущих вычисления, перевалило за семь миллионов, а суммарная производительность оценивается в семь петафлопс — это мощнее, чем суперкомпьютер JUQUEEN, занимающий пятую строчку ноябрьского рейтинга TOP 500.

Использование BOINC

Нецелевое использование BOINC эффективно пресекается. Люди, которые стоят за платформой, внимательно следят за соблюдением условий лицензии. Проекты, которые нарушают правила, отклоняют и закрывают — особенно в том случае, если под видом фундаментальных исследований добровольцам пытаются подсунуть коммерческие задачи. Это происходит не так уж редко: идея бесплатно воспользоваться чужим трудом прельщает многих.

Отклонённые проекты из списка поддерживающих ускорение на ГП

Это не значит, что BOINC принципиально настроен против коммерции. Организации (в том числе коммерческие) могут использовать платформу BOINC и свои компьютеры для решения практически любых задач. Правила лишь запрещают привлекать волонтёров к проектам, подразумевающим извлечение прибыли.

Варианты использования платформы BOINC

Участники распределённых вычислений

Большая часть проектов – международные. Активнейшее участие принимают Германия и Евросоюз в целом. Вклад научных учреждений России пока сравнительно мал, однако за счёт обычных пользователей российский сегмент участников BOINC в мировом масштабе выглядит солидно.

Суммарная производительность узлов сети на платформе BOINC в мире

Хорошим способом привлечь внимание и увеличить производительность сетей распределённых вычислений считается проведение всевозможных конкурсов. Эта таблица с результатами участников соревнования BOINC по правилам чемпионата «Формулы-1» говорит сама за себя (синим цветом отмечены международные команды).

Соревнования по правилам «Формулы-1» в области распределённых вычислений

Если не считать конкурсов, то даже в популярных проектах львиную долю работы выполняет горстка активных пользователей. Посмотрите хотя бы статистику проекта Einstein@home по состоянию на начало декабря 2012 г.

Общее число и доля активных участников проекта Einstein@home

В последней строке учитываются те участники, которые за последние две недели выполнили расчёт хотя бы одного присланного задания. Как видим, их доля составляет всего 7,5 процента. Остальные — полумёртвые души.

Программа поощрений

Такая динамика отчасти объясняется малой отдачей, которую пользователи ощущают от проекта. Кроме осознания факта, что они внесли некоторый вклад в развитие науки, и таких вот «сертификатов», они обычно не получают ничего.

Сертификаты участника проектов BOINC

Иногда бывают предусмотрены и другие поощрения. Пользователям, на чьих компьютерах был обработан пакет данных, позволивший сделать открытие, могут прислать подтверждающий этот факт документы. Правда, даже в этом случае всё, как правило, ограничивается поздравлением в электронной форме – даром что человек, возможно, участвовал в распределённых вычислениях годами.

Денежные вознаграждения и вовсе редкость, несмотря на то что их эффективность очевидна. Не последнюю роль в успехе проекта поиска чисел Мерсенна сыграли денежные призы, выплачиваемые Фондом электронных рубежей (EFF) за нахождение простого числа, состоящего из более чем N десятичных цифр.

Впрочем, распределённые вычисления не останавливаются. Людей, которые считают, что будущее куда интереснее творить, чем просто ждать его, пока хватает. Разделяющие эту точку зрения могут прямо сейчас отправиться на страницу загрузки BOINC и попробовать внести свой малый, но реальный вклад в науку.

Продолжение: настраиваем клиент BOINC и выбираем проект.

Что будем искать? Например,ChatGPT

Мы в социальных сетях