«Наносемантика» разработала программный комплекс для голосового управления роботами

Российская компания «Наносемантика» создала универсальный программный комплекс, позволяющий управлять роботами с помощью естественной речи. Система не требует мощного оборудования — для работы достаточно устройства с микрофоном и динамиком.

«Наносемантика» разработала программный комплекс для голосового управления роботами

Основой комплекса является платформа DialogOS. Она обрабатывает естественную речь, распознает и синтезирует ее, а также взаимодействует с другими системами через API. Технология позволяет роботам понимать свободные формулировки и интонации, а не только жесткий набор команд.

В состав продукта входят собственные разработки компании: диалоговая платформа DialogOS, модуль распознавания речи NLab Speech ASR и модуль синтеза NLab Speech TTS. Архитектура системы поддерживает интеграцию с различными крупными языковыми моделями, включая Gemini и отечественные аналоги.

Как отмечают в компании, комплекс построен по клиент-серверной архитектуре. На стороне робота работает облегченный клиент, а основная нагрузка по обработке речи и работе с языковыми моделями приходится на сервер. Такой подход, по заявлению разработчиков, обеспечивает стабильную работу системы на оборудовании с ограниченной вычислительной мощностью и упрощает ее централизованное обновление.

Система прошла испытания на роботе-собаке «Квант». Робот способен вести диалог, реагировать на имя и выполнять голосовые команды в реальном времени. По оценке представителей компании, данный комплекс способен упростить и удешевить внедрение роботизированных систем в различных отраслях, таких как логистика и сервисная робототехника, за счет стандартизации голосового управления.

Что будем искать? Например,ChatGPT

Мы в социальных сетях