Проект Тихо: эпидемиологи оцифровали информацию о распространении инфекционных заболеваний за 125 лет

Исследователи из Питсбургского университета проделали грандиозную работу: они собрали, оцифровали и опубликовали в интернете архивные записи о случаях заражения инфекционными заболеваниями, зарегистрированных в Соединённых Штатах в период с 1888 по 2013 год. Учёные полагают, что эта информация позволит лучше понять механизм распространения эпидемий и влияние, которое оказывает на этот процесс вакцинация. Кроме того, она поможет отладить математические модели, используемые эпидемиологами.

«Проект Тихо» финансировался на средства, предоставленные фондом Билла и Мелинды Гейтс и Национальным институтом здравоохранения США. Исследователи сумели отыскать и перевести в машиночитаемый вид все таблицы наблюдения за распространением 56 различных инфекционных заболеваний, публиковавшиеся каждую неделю в течение более чем 125 лет. Общее количество таблиц составляет около 6,5 тысячи. Они, в частности, содержат сведения о количестве погибших и местах, где зафиксированы вспышки эпидемии.

«Тихо» в названии проекта отсылает к имени датского астронома XVI века Тихо Браге. Немецкий учёный Иоганн Кеплер использовал данные, которые много лет собирал Тихо Браге, чтобы сформулировать законы движения планет Солнечной системы. Законы Кеплера, в свою очередь, послужили фундаментом, на котором Исаак Ньютон построил теорию тяготения.

«Данные Тихо Браге были необходимы для совершённого Кеплером открытия законов планетной кинематики, — говорит один из авторов проекта Дональд Бурке. — Мы надеемся, что база данных инфекционных заболеваний в нашем “Проекте Тихо” поможет подхлестнуть новые исследования закономерностей распространения эпидемий и влияния на него вакцин».

«Анализ исторических эпидемиологических данных способен выявить закономерности, которые помогут нам понять, каким образом распространяются инфекционные болезни и какие способы вмешательства наиболее эффективны, — говорит Ирена Экстренд из Национального института здравоохранения США. — Эта работа демонстрирует ценность использования вычислительных методов при изучении исторических данных».

Сбор данных и статистический анализ всегда были ценнейшим инструментом в арсенале эпидемиолога. Мы писали об этом в статье «Как “большие данные” вскрывают невидимые пути распространения эпидемий«, начинающейся с истории о победе статистики над холерой в Лондоне XIX века и заканчивающейся рассказом о современных исследователях, которые анализируют гигантские наборы данных, полученные у операторов мобильной связи, чтобы установить пути распространения малярии в Кении.

Что будем искать? Например,ChatGPT

Мы в социальных сетях