В одном из крупнейших медицинских комплексов Америки – центре Горы Синай (Нью-Йорк) – в дополнение к имеющемуся суперкомпьютеру стоимостью три миллиона долларов устанавливают новый кластер. Его архитектуру разрабатывали при участии Джеффа Хаммербакера, в прошлом приложившего руку к созданию рекламной системы Facebook, а затем основавшего компанию Cloudera. Он предложил использовать для сокращения расходов на здравоохранение те же подходы к обработке больших массивов данных, которые успешно применяет Facebook при анализе пользовательских профилей для подбора персонализированной рекламы.

США ежегодно тратят на здравоохранение более трёх триллионов долларов. Комплекс Горы Синай вместе с аффилированной медицинской школой ежегодно госпитализирует около полумиллиона человек. Число медицинских записей в электронной картотеке превысило 120 миллионов. Недавно к ним добавилась база данных биобанка, насчитывающая 26 735 образцов ДНК. Обработка возрастающего количества разнородных данных – один из ярких примеров современных проблем ИТ-инфраструктуры и одна из типичных задач в области Big Data.

Суперкомпьютер в Медицинском центре Горы Синай (фото: Patricia Kovatch)
Суперкомпьютер в Медицинском центре Горы Синай (фото: Patricia Kovatch).

Ранее оперативно учесть сотни показателей работы медицинских учреждений было технически невозможно, поэтому на банковский счёт госпиталей поступали средства, пропорциональные общему числу койко-дней и количеству выполненных манипуляций. Из-за этого сформировалась порочная система, в которой выгодно было проводить избыточную диагностику, назначать лишние консультации и затягивать лечение.

Текущая реформа здравоохранения США использует возможности более тонкой работы с данными. Её авторы придерживаются концепции “подотчётной помощи”, в рамках которой будет оцениваться прежде всего эффективность проведённого лечения. Таким образом, благодаря технологиям “больших данных” платить будут не столько за процесс лечения, сколько за способность быстро излечивать и поддерживать здоровье пациентов.

Гора Синай - обсуждение роли Big Data в реформе здравоохранения (фото: mountsinai.org)
Гора Синай – обсуждение роли Big Data в реформе здравоохранения (фото: mountsinai.org).

Один из привлечённых экспертов – сотрудник института геномики и биолог компании Pacific Biosciences Эрик Шадт (Eric Schadt) так прокомментировал ситуацию изданию MIT Technology Review:

Это чудовищно огромная ставка на обработку больших объёмов данных. Новые экономические стимулы объясняют, почему госпитали вдруг стали испытывать такую высокую потребность в специалистах по вопросам Big Data. Только из нашего института в прошлом году было нанято сто пятьдесят человек.

Другим важным направлением стало прогнозирование расходов. Оно базируется на многофакторном анализе таких статистических данных, как число повторных обращений, процент жалоб на конкретных врачей и подразделения, распространённость различных патологий, количество пациентов с хроническими заболеваниями, а также на эпидемиологических показателях. Все эти данные будут обрабатываться на новом кластере в свободно распространяемой системе распределённых вычислений Hadoop.