Исследователи из Питсбургского университета проделали грандиозную работу: они собрали, оцифровали и опубликовали в интернете архивные записи о случаях заражения инфекционными заболеваниями, зарегистрированных в Соединённых Штатах в период с 1888 по 2013 год. Учёные полагают, что эта информация позволит лучше понять механизм распространения эпидемий и влияние, которое оказывает на этот процесс вакцинация. Кроме того, она поможет отладить математические модели, используемые эпидемиологами.

Проект Тихо” финансировался на средства, предоставленные фондом Билла и Мелинды Гейтс и Национальным институтом здравоохранения США. Исследователи сумели отыскать и перевести в машиночитаемый вид все таблицы наблюдения за распространением 56 различных инфекционных заболеваний, публиковавшиеся каждую неделю в течение более чем 125 лет. Общее количество таблиц составляет около 6,5 тысячи. Они, в частности, содержат сведения о количестве погибших и местах, где зафиксированы вспышки эпидемии.

Screen Shot 2013-12-02 at 23.59.55

“Тихо” в названии проекта отсылает к имени датского астронома XVI века Тихо Браге. Немецкий учёный Иоганн Кеплер использовал данные, которые много лет собирал Тихо Браге, чтобы сформулировать законы движения планет Солнечной системы. Законы Кеплера, в свою очередь, послужили фундаментом, на котором Исаак Ньютон построил теорию тяготения.

“Данные Тихо Браге были необходимы для совершённого Кеплером открытия законов планетной кинематики, – говорит один из авторов проекта Дональд Бурке. – Мы надеемся, что база данных инфекционных заболеваний в нашем “Проекте Тихо” поможет подхлестнуть новые исследования закономерностей распространения эпидемий и влияния на него вакцин”.

“Анализ исторических эпидемиологических данных способен выявить закономерности, которые помогут нам понять, каким образом распространяются инфекционные болезни и какие способы вмешательства наиболее эффективны, – говорит Ирена Экстренд из Национального института здравоохранения США. – Эта работа демонстрирует ценность использования вычислительных методов при изучении исторических данных”.

Сбор данных и статистический анализ всегда были ценнейшим инструментом в арсенале эпидемиолога. Мы писали об этом в статье “Как “большие данные” вскрывают невидимые пути распространения эпидемий“, начинающейся с истории о победе статистики над холерой в Лондоне XIX века и заканчивающейся рассказом о современных исследователях, которые анализируют гигантские наборы данных, полученные у операторов мобильной связи, чтобы установить пути распространения малярии в Кении.