В МИФИ разработали уникальную систему для выявления поддельных аудиозаписей. Нейросеть «Сипуха» анализирует голос и определяет, настоящий он или создан искусственным интеллектом.

Сотрудники и студенты кафедры криптологии и кибербезопасности НИЯУ МИФИ под руководством кандидата технических наук, доцента Дмитрия Ефанова разработали интеллектуальную систему для выявления голосовых дипфейков.
Проект под названием «Сипуха» — в честь птицы с острым слухом — победил в конкурсе «Новатор Москвы». В основе системы лежит нейросеть, обученная на более чем 200 тыс. записей, включающих как реальные голоса, так и подделки, сгенерированные разными алгоритмами. Анализ кепстральных коэффициентов — ключевых математических характеристик аудиосигналов — позволяет системе обнаруживать дипфейки даже в коротких фрагментах длиной 20–40 микросекунд.
Изначально проект, начатый в 2022 году, носил чисто академический характер, так как подделка голоса тогда требовала значительных ресурсов и не была массовым явлением. Первую поддержку оказал Фонд содействия инновациям. Однако к 2024 году технологии синтеза голоса стали доступнее, и мошенники начали активно их использовать. Это придало разработке прикладное значение. «Сипуха» вошла в число финалистов Технологического акселератора МИФИ и «Росатома», пройдя отбор из 60 заявок.
Сейчас команда работает над созданием облачного сервиса, который позволит интегрировать проверку на дипфейки в колл-центры, мессенджеры и другие системы коммуникации. Интерес к сервису уже проявили «ТБанк» и «Информзащита». В будущем планируется открыть исследовательскую лабораторию для постоянного улучшения нейросети, поскольку методы создания дипфейков непрерывно развиваются.
