Содержание
Источник: https://cyberleninka.ru/article/v/ergonomichnyy-golosovoy-interfeys-upravleniya-antropomorfnym-robotom

Человекоподобные роботы находят широкое применение в различных областях научной и хозяйственной деятельности. Но эргономичное управление такими роботами является серьёзной и актуальной проблемой. Стандартные компьютерные интерфейсные устройства не обеспечивают достаточный уровень эргономики. Поэтому в качестве альтернативы часто используют экзоскелеты. Они представляют собой жёсткие откидные конструкции, надеваемые оператором и соответствующие строению человеческого тела. С помощью экзоскелета можно реализовать копирующий режим управления, т.е. робот будет в точности повторять движения оператора. Но и он имеет свои недостатки: большой вес и недопустимость работы с ним в скафандре. Поэтому предлагается использовать голосовой интерфейс управления роботом. Идея заключается в распознавании голосовой команды и выполнении заданного ею действия. Эксперименты показали успешное использование голосового интерфейса.

В данной работе предлагается использовать устройство Кинект для голосового управления роботом в командном режиме.




 
 
Система управления голосовым интерфейсом.
Система управления включает в себя функциональную схему и модуль расчёта управляющего сигнала. Функциональная схема создаётся в специальном визуальном редакторе, включающем поле редактора и библиотеку функциональных блоков. Пользователь может перемещать блоки из библиотеки на поле редактора и присоединять входы одних блоков к выходам других. Многие блоки имеют индивидуальные параметры настройки, которые задаются через диалоговое окно. Также блоки, входы и выходы имеют всплывающие подсказки, что помогает в них ориентироваться. Всё это в целом позволяет быстро разрабатывать, анализировать и выявлять ошибки функционирования схемы. 
Для рассматриваемой задачи были созданы два новых блока: один, в котором может быть записана произвольная фраза, и второй, в которой в качестве параметра записано имя скрипта. Первый блок вызывает систему распознавания речи и получает от неё фразу, распознанную в данный момент времени. Затем он сравнивает полученную фразу со своей и в случае совпадения отправляет сигнал. В свою очередь второй блок получает этот сигнал и выполняет заданные в нём действия. 
 
Система распознавания речи.
В качестве системы распознавания речи выбрана открытая кроссплатформенная система, которая включает в себя несколько различных словарей, а также предоставляет возможность составить собственный словарь. В данной работе система прослушивала эфир, распознавала слова и записывала их в буфер. При произнесении паузы система считала, что фраза закончена, и посылала её на выход.На этапе работы приложения в основном цикле программы вызываются функции записи звука микрофона и распознавании записанных фраз. В случае успешного распознавания нам возвращается фраза в виде текстовой строки. 
 
Система создания и выполнения скриптов.
Важнейшая составляющая в идеологии управления роботами - работа со скриптовыми командами. Скриптовая команда состоит из текстовой строки, задающей назначение и тип команды, и связанных с ней данных произвольного формата и размера. Такой язык даёт возможность изменить практически любые параметры с помощью универсального механизма. Система включает в себя большое количество поддерживаемых команд: системные команды, команды работы с материалами, команды управления узлами сцены, команды работы с анимационными треками, команды настройки мыши, клавиатуры и джойстика, команды работы со звуком, команды работы с выводом изображения, команды записи и записывания лог-файлов. Последний тип команды наиболее востребован, с её помощью можно полностью записать движения робота, а затем вызвать проигрывание записанной операции. Лог-файлы реализованы в подсистеме визуализации виртуальных сцен и предназначены для хранения и записи всех необходимых параметров. 
 
В заключение отметим, что в статье был рассмотрен программный пакет, включающий в себя систему управления голосовым интерфейсом, систему распознавания речи и систему создания и выполнения скриптов, разработанный НИИСИ РАН,. Эксперимент показал возможность успешного использования голосового интерфейса антропоморфными роботами.