Совместное финансирование наукоёмких проектов широко используется во многих странах. На Kickstarter успешно собирали средства даже на плазменный двигатель и космический телескоп стоимостью полтора миллиона долларов. Российский уровень научно-общественных инициатив гораздо скромнее, зато они быстрее выполняются и проще отслеживаются. Показательной стала история проекта известного кранчера Александра Андреева, входящего в состав российского отделения IDGF. Идея собрать общественный сервер для выполнения научных расчётов и установить его в дата-центре ИППИ РАН оказалась самой популярной в разделе «Технологии» отечественной крауд-платформы Boomstarter.

Скоро Александр приступит к сборке сервера, средства на которые удалось собрать в рекордные сроки. Изначально у всех были большие сомнения в успехе, однако они развеялись уже через неделю. Менее чем за половину расчётного времени проект был полностью профинансирован и продолжает привлекать спонсоров.

Руководитель команды Russia Team с организаторами российских проектов РВ на Национальном суперкомпьютерном форуме (фото: boinc.ru).
Руководитель команды Russia Team с организаторами российских проектов РВ на Национальном суперкомпьютерном форуме (фото: boinc.ru).

Время героев-одиночек в науке постепенно проходит. Современные исследования – это коллективный труд, в котором приходится обрабатывать колоссальные объёмы данных и сопоставлять разные точки зрения. Традиционно для анализа использовались мощные компьютеры, но сложности решаемых задач неуклонно возрастают.

Сегодня они давно превосходят возможности вычислительных систем, которые могут позволить себе научные коллективы. К примеру, группа профессора химии Марка Томпсона рассчитала энергию двухсот пятидесяти тысяч различных молекул – потенциальных кандидатов на роль нового покрытия солнечных панелей. Для этого восемь дата-центров Amazon загрузили на восемнадцать часов. На университетских компьютерах исследователи бы обсчитывали четверть миллиона молекул до конца своей жизни, и всё равно бы не успели.

Суперкомпьютеры требуются потому, что большинство исследований сегодня сопряжено с огромным объёмом вычислений. Физикам, астрономам, химикам, генетикам и другим учёным требуется обрабатывать терабайты данных после каждой серии экспериментов. Они проверяют миллионы вариантов, вычисляя пространственные конфигурации органических молекул, моделируют поведение элементарных частиц, работу мозга человека, глобальные процессы на Земле и во всей видимой части Вселенной.

Моделирование развития звездных скоплений и потока Стрельца в проекте Milkyway@Home (изображение: caltech.edu).
Моделирование развития звездных скоплений и потока Стрельца в проекте Milkyway@Home (изображение: caltech.edu).

Все эти сверхзадачи подразумевают наличие развитого математического аппарата, поскольку в конечном счёте формулируются на языке единиц и нулей, а скорость их выполнения зависит от качества алгоритмов. Многие задания для суперкомпьютеров связаны с проверкой математических гипотез, развитием методов математического анализа и поиска оптимальных стратегий в решении задач определённого класса.

По данным мирового рейтинга TOP500 в этом году удвоилось число мощных российских суперкомпьютеров. Большая часть из них предназначена как раз для научных расчётов и установлена в вычислительных центрах крупных университетов страны. Однако на практике их использование затруднено целым рядом причин, главными из которых остаются бюрократические препятствия, а также скудный и специфический набор доступных программных средств.

Классический вариант прогресса, в котором прикладные дисциплины развиваются за счёт достижений фундаментальной науки, тормозится человеческим фактором. Получить одобрение заявки на использование ресурсов любого суперкомпьютера для многих научных коллективов становится неразрешимой проблемой. Им вежливо (и не очень) отказывают, не видя в таком сотрудничестве выгоды. Ведь счёт за электроэнергию для суперкомпьютеров оплачивает один ВУЗ, а рейтинг растёт у другого.

Расчёт энергии белковых молекул в проекте Rosetta@Home (изображение: imgur.com).
Расчёт энергии белковых молекул в проекте Rosetta@Home (изображение: imgur.com).

В поисках выхода группы исследователей обращаются к другому методу решения сложных математических задач – распределённым вычислениям (РВ) на компьютерах добровольцев. «Компьютерра» уже писала об открытой платформе BOINC. Она объединяет свободные вычислительные ресурсы любой компьютерной техники (от кластеров до смартфонов) сотен тысяч волонтёров по всему миру. На момент написания статьи их суммарная мощность превышала восемь петафлопс, что сравнимо с производительностью суперкомпьютера Mira (BlueGene/Q), занимающего пятую строчку рейтинга в последнем списке TOP500.

Однако доля активных участников в BOINC всегда была мала. Для новых проектов она составляет считанные проценты, а в самых популярных редко превышает одну треть. Многие участники надолго приостанавливают расчёты, поэтому даже один круглосуточно работающий мощный компьютер или небольшой сервер вносит ощутимый вклад в общее дело.

За двадцать три дня до намеченной даты сбор средств на сервер для кранч-центра уже выполнен на 113%. Даже с учётом выросшего курса доллара, собранной суммы хватает на приобретение шестиядерного процессора Intel Xeon E5-2620v2 с поддержкой Hyper-Threading и материнской платы серверного класса с двумя процессорными гнёздами. Если приток пожертвований продолжится, то второй сокет не будет пустовать, а конфигурацию сервера продолжат совершенствовать. Возможно, в нём даже появятся векторные ускорители как в настоящих суперкомпьютерах. Благо, все проекты в BOINC исключительно легко масштабируются и поддерживают вычисления в гетерогенной среде.

В дата-центре ИППИ РАН для РВ используют как сервер, так и простые системные блоки уровня SOHO, объединённые с помощью платформы BOINC (фото: boinc.ru).
В дата-центре ИППИ РАН для РВ используют как сервер, так и простые системные блоки уровня SOHO, объединённые с помощью платформы BOINC (фото: boinc.ru).

На первом этапе в дата-центре ИППИ РАН появится система с двенадцатью, а затем и с двадцатью четырьмя логическими ядрами, которые будут загружены 24 часа в сутки решением научных задач. За этой красивой метафорой скрывается и тот факт, что участники команды будут поддерживать работу компьютера своими силами.

Распределением вычислительных ресурсов будет заниматься «Russia Team» – одна из сильнейших российских команд добровольных РВ с почти десятилетней историей. Её организаторы планируют использовать новый сервер для поддержки, в первую очередь, отечественных научных проектов, одним из которых стал SAT@Home.

С каждым днём методы привлечения ресурсов добровольцев находят применение в решении всё более серьёзных задач. Особенность крауд-технологий заключается в том, что они стимулируют друг друга. Одно глобальное движение помогает реализовать другое. В этом и кроется главный секрет большинства амбициозных проектов.