Технологии Big Data выводят современную биологию на новый уровень

Сегодня исследователи предлагают новые способы описания биологических видов, которые выходят далеко за рамки сложившихся традиции. Разрабатываемые подходы сочетают в себе несколько методов, включая молекулярную биологию, кодирование и картирование, а также технологии визуализации. Все вместе они опираются на методы обработки больших объёмов данных, известные под общим названием Big Data.

Таксономические описания, введённые Карлом Линнеем в 1735 году, были разработаны для того, чтобы различать биологические виды. В их основу легли главным образом внешние признаки, поскольку биология того времени была описательной наукой. Современники Линнея не обладали ни огромными подборками результатов исследований, ни методами оценки их достоверности, ни аналитическими инструментами для их обработки.

Между тем эволюция продолжается как в природе, так и в науке. Только за прошлый год было открыто 13 494 новых видов, и такие темпы открытий даже породили новый термин для процесса их ускоренного описания — «турботаксономия».

Параллельно быстрыми темпами развиваются и методы углубленного исследования. Например, сороконожка Eupolybothrus cavernicolus стала первым эукариотическим видом, для которого, помимо традиционного морфологического описания, была сделана рентгеновская микротомография, составлен генетический профиль и описаны особенности поведения.

Руководитель международной группы биологов профессор Любомир Пенев отмечает, как сложность задачи сбора данных уходит на второй план, вытесняясь проблемой их обработки:

«Уже недостаточно просто собрать большой объём данных [о новом виде]. Реальная проблема возникает в тот момент, когда требуется управлять ими: рецензировать, сделать доступными и распространяемыми так, как это принято в научном мире».

Исполнительный редактор GigaScience доктор Скотт Эдмундс (Scott Edmunds) также отмечает, что области применения описаний биологических видов сегодня выходят за рамки их простого сравнения друг с другом:

«Таксономические характеристики используются при исследовании биологического разнообразия и в мониторинге экосистем. В ходе решения этих глобальных задач требуется сопоставлять многочисленные геномные данные из разных баз и сетевых хранилищ».

Для автоматизации этого процесса сегодня используется кодирование генетических последовательностей и других биологических данных штрихкодом, активно применяются облачные сервисы и методы коллективной удалённой работы исследователей над научными проектами.

Что будем искать? Например,ChatGPT

Мы в социальных сетях