Нейросеть научит роботов видеть объемно и без «слепых» зон

Международный коллектив с участием исследователей МФТИ представил алгоритм Un-ViTAStereo, который определяет расстояние до объектов без лидаров и ручной разметки. Система сохраняет точность даже перед гладкими стенами, в густой листве и тумане — там, где традиционные алгоритмы терпят неудачу.

Нейросеть научит роботов видеть объемно и без «слепых» зон

Стереосистемы беспилотных автомобилей и роботов работают по аналогии с человеческим зрением: две камеры передают изображения, а алгоритмы сопоставляют их, чтобы построить карту глубины. Однако этот механизм дает сбой при недостатке визуальных зацепок — например, перед идеально белой стеной или в зоне с повторяющимися узорами.

Чтобы преодолеть этот барьер, ученые ввели в процесс обучения нейросети «наставника» — модель Depth Anything V2, которая оценивает относительную глубину по одному изображению. Она не измеряет метры, но точно определяет, какой объект ближе, а какой дальше, анализируя тени, перспективу и перекрытия. Алгоритм отбирает только те предсказания стереосистемы, которые согласуются с подсказками наставника, и учит нейросеть повышать точность.

Как пояснил руководитель проекта Научно-технического центра телекоммуникаций МФТИ Александр Дворкович, система работает в три этапа. Сначала алгоритм проверяет каждый пиксель на соответствие подсказкам, маркируя верные данные и ошибки. Затем функция потерь находит вокруг ошибочных пикселей несколько корректных соседей, которые служат ориентирами для исправления. На финальном этапе другой алгоритм убирает цифровой шум в однородных областях, сохраняя четкость контуров объектов.

Тестирование на стандартных датасетах подтвердило эффективность разработки. На бенчмарке для беспилотников KITTI 2015 долю грубых ошибок удалось снизить до 5%, что означает сокращение опасных неточностей в определении расстояний до бордюров и пешеходов на 23% по сравнению с аналогами.

Текущая версия Un-ViTAStereco рассматривается учеными как базовая. В планах — создание самообучающейся нейросети, способной адаптироваться к разным средам: от городских улиц до заводских цехов, а также использование редких точных измерений лидаров в качестве дополнительных ориентиров для дальнейшего повышения точности.

Читайте также: «В России заработал онлайн-калькулятор, измеряющий биологический возраст мозга».

Что будем искать? Например,ChatGPT

Мы в социальных сетях