Новый алгоритм идентификации был опробован в лаборатории искусственного интеллекта Facebook. На выборке из сорока тысяч фотографий людей, скрывающих лица или стоящих спиной, он смог верно идентифицировать их в 83% случаев. Отсутствие чётких изображений лиц не помешало новой системе машинного зрения уверенно опознавать людей, не желающих быть узнанными.

Как поясняют разработчики, лицо – значимая, но далеко не единственная индивидуальная черта на фотографии. Среди визуальных отличий есть много других: причёска и цвет волос, пропорции и контуры тела, типичная поза, едва заметная глазом асимметрия, любимая одежда и атрибутика, расположение родинок, шрамов и других особенностей. Многое из этого мы не замечаем сами, но машинное зрение всегда даёт беспристрастную оценку. Это позволяет ему избегать свойственных человеку ошибок восприятия и довольно уверенно распознавать людей даже тогда, когда они совсем не хотят быть узнанными.

Роб Фергюс и Ян Лекун в Facebook AI Lab (фото: wired.co.uk).
Роб Фергюс и Ян Лекун в Facebook AI Lab (фото: wired.co.uk).

Алгоритм самообучается с каждой новой фотографией, уточняя образ человека за счёт новых ракурсов и более качественных снимков. На каждом изображении человека сперва выделяются оценочные параметры. Затем все собранные данные подвергаются статистическому анализу и создают общую картину, которая и сравнивается с базой.

Возглавляет лабораторию искусственного интеллекта Facebook французский программист Ян Лекун (Yann LeCun). Широкой общественности он известен как соавтор языка Lush и формата DjVu. В академической среде его прославили многочисленные работы в области машинного обучения, компьютерного зрения и вычислительной нейробиологии.

Ян Лекун (фото: embedded-vision.com).
Ян Лекун (фото: embedded-vision.com).

Перспективный алгоритм распознавания людей базируется на эффекте самообучения свёрточных нейронных сетей (CNN – convolutional neural network). Они были разработаны Яном Лекуном в противовес рекуррентым нейросетям, получивших распространение во многих сферах – от анализа изображений до генерирования текстов по образу и подобию заданных.

Рекуррентные сети прекрасно копируют форму, но практически бесполезны для идентификации по нечётким снимкам или фотографиям с закрытым лицом. Они отличаются наличием обратных связей между группами нейронов, которые дают возможность формировать динамические зависимости. При изменении состояния хотя бы одного нейрона происходит значимое изменение всей сети, поскольку связь устроена по принципу мультиплексирования – «один ко многим».

Свёрточные нейронные сети устроены иначе. Они максимально точно моделируют работу нейронов зрительной коры, состоящей из нейронов двух функционально разных типов. В ней чередуются свёрточные слои, разбивающие изображения на элементы, и субдискретизирующие – выполняющие предвыборку полученных данных. Суть последней операции состоит в более чувствительном способе поиска искомого признака. На этом этапе важен только факт его наличия без учёта дополнительных условий, вроде точной локализации.

Сама сеть не имеет обратных связей, но способна обучаться по методу обратного распространения ошибки (backpropagation), описанного в середине семидесятых профессором Александром Ивановичем Галушкиным. Этот итеративный алгоритм представляет собой модификацию метода градиентного спуска и позволяет минимизировать ошибки в работе многослойной нейросети.

Галушкин А. И. (фото: it.mgppu.ru).
Галушкин А. И. (фото: it.mgppu.ru).

Возможности нового алгоритма были продемонстрированы на конференции Computer Vision and Pattern Recognition в Бостоне. Точность распознавания фотографий людей с закрытыми лицами из подборки Flickr составила 83%. «Есть много сигналов, которые мы используем для идентификации. Все люди имеют характерные особенности, даже если вы смотрите на них со спины», – пояснил Ян Лекун в своём выступлении.

После тонкой доработки и обучения на большем количестве фотографий алгоритм будет использоваться в сервисе Facebook Moments и других средствах автоматической каталогизации изображений. Впрочем, уже сейчас очевидно, что это средство двойного назначения. Возможность опознать человека на фотографии вопреки его желанию – давняя мечта охранных агентств, полиции и служб разведки.