Российские ученые научились распознавать 3D-объекты с минимальными затратами памяти

Специалисты факультета вычислительной математики и кибернетики Московского государственного университета имени М. В. Ломоносова представили новый подход к идентификации трехмерных объектов. Разработанный метод основан на преобразовании пространственных данных в графовые структуры с последующим использованием нейросетевых алгоритмов.

В современных робототехнических системах и средствах автономной навигации для получения информации об окружении широко применяются лидары и другие сканирующие устройства. Они генерируют данные в виде так называемых «облаков точек» — неупорядоченных массивов координат, отражающих поверхность объектов. Однако такая форма представления лишена внутренней топологической структуры, что затрудняет ее обработку и требует значительных вычислительных мощностей, особенно при работе с большими объёмами данных.

Для повышения эффективности анализа авторы проекта предложили методику агрегации исходного множества точек. Вместо обработки каждого элемента облака ученые сводят массив к набору базовых геометрических примитивов — плоскостей, цилиндров, сфер и подобных фигур — а также фиксируют отношения между ними. Итоговая модель объекта представляется в виде графа: его вершины соответствуют отдельным примитивам, а ребра обозначают наличие или отсутствие пространственных пересечений между этими элементами.

Как пояснил доцент кафедры суперкомпьютеров и квантовой информатики ВМК МГУ Илья Никольский, сама идея графового представления трехмерных объектов не является новой. Однако главное отличие предложенного подхода заключается в значительном сокращении объема сохраняемой информации. Для описания формы используется минимальный набор геометрических фигур, а связи между ними характеризуются единственным бинарным признаком. Такая схема позволяет уменьшить требуемый объем памяти при сохранении достаточной точности распознавания.

Экспериментальная проверка разработанного метода проводилась на базе общедоступной коллекции трехмерных моделей ShapeNet, которая включает большое количество различных предметов. Результаты тестов показали, что для многих типов объектов повседневного использования минималистичного графового описания оказывается достаточно для корректной идентификации с применением графовых нейронных сетей стандартной архитектуры.

Разработка ориентирована на практическое применение в областях, где критичны ограничения по вычислительным ресурсам, — в первую очередь в робототехнике и системах автономного управления. Предложенный подход может быть полезен для быстрого распознавания окружающих предметов в реальном времени, когда обработка полного облака точек затруднена из-за недостатка производительности бортовых вычислителей.

Подписывайтесь на наш Telegram Подписаться