Российская компания «Наносемантика» создала универсальный программный комплекс, позволяющий управлять роботами с помощью естественной речи. Система не требует мощного оборудования — для работы достаточно устройства с микрофоном и динамиком.

Основой комплекса является платформа DialogOS. Она обрабатывает естественную речь, распознает и синтезирует ее, а также взаимодействует с другими системами через API. Технология позволяет роботам понимать свободные формулировки и интонации, а не только жесткий набор команд.
В состав продукта входят собственные разработки компании: диалоговая платформа DialogOS, модуль распознавания речи NLab Speech ASR и модуль синтеза NLab Speech TTS. Архитектура системы поддерживает интеграцию с различными крупными языковыми моделями, включая Gemini и отечественные аналоги.
Как отмечают в компании, комплекс построен по клиент-серверной архитектуре. На стороне робота работает облегченный клиент, а основная нагрузка по обработке речи и работе с языковыми моделями приходится на сервер. Такой подход, по заявлению разработчиков, обеспечивает стабильную работу системы на оборудовании с ограниченной вычислительной мощностью и упрощает ее централизованное обновление.
Система прошла испытания на роботе-собаке «Квант». Робот способен вести диалог, реагировать на имя и выполнять голосовые команды в реальном времени. По оценке представителей компании, данный комплекс способен упростить и удешевить внедрение роботизированных систем в различных отраслях, таких как логистика и сервисная робототехника, за счет стандартизации голосового управления.
