Программа для голосового управления компьютером
Cortana для Windows
К особенностям можно отнести такую функцию, как предугадывание желаний пользователя. Если дать доступ к личным данным, виртуальный помощник от Microsoft будет «подстраиваться» под вас, постоянно анализируя ваши действия: места, в которых вам нравится находиться; ваши предпочтения в тех или иных вещах; ваши долгосрочные интересы, хобби и многое другое.
Виртуальный ассистент Cortana тесно связана с операционной системой и может управлять Windows 10 и отдельными приложениями во время вашей работы: поможет прочитать Ваши электронные письма, отследить местоположение, проверить список контактов, следить за календарем, управлять музыкой и напоминания, охватывая многочисленные музыкальные приложения и контролируя звук в соответствии с предпочтениями пользователя.
Есть возможно синхронизации нескольких устройств. Cortana будет поддерживать актуальность на нескольких компьютерах одновременно.
Алиса Яндекс (десктопная версия)
Алиса – голосовой помощник, устанавливаемый на ПК (Windows 7-10), Android и IOS. Алиса может показать прогноз погоды, найти данные об общественных местах, найти музыку, проводить конвертацию валют, решает несложные математические вычисления и может поддержать разговор. Программа очень молодая и все время совершенствуется. «Алиса» позволяет вести диалог в текстовом виде и голосовом. Голосовой помощник Алиса способен понимать смысл ваших фраз: «Где здесь можно пошопиться?», она понимает: «Где здесь магазины?».
Поисковая строка Яндекс или другое название – Яндекс.Строка находится в панели задач операционной системы Windows. Поисковая строка Яндекс умеет находить на просторах Интернета информацию, которую пользователь вводить с помощью голоса или текста. Пользователь может задать команду открыть любую папку и документ, расположенные на компьютере. Программа открывается на портативном компьютере с помощью нажатия кнопки Строки или же горячих клавиш. По сути это частный случай Алисы для ПК. Для экономии места на панели задач 8 см кнопку заменяют на иконку с микрофоном. Подробнее способах отображения помощника на ПК в статье Настройки Алисы для Windows.
Программа разработана для операционной системы Windows. Здесь не нужны знания английского языка, нет возможности работы с плеером и нет восприятия текстовой формы. Из-за ограниченного количества функций программа кажется не такой эффективной и функциональной в использовании. Ограниченность помощника заключается в открывании лишь утилитов и Интернет-страниц. Программа понимает шумы из вне, как команды для выполнения, отчего компьютер может работать не корректно. Голосовой помощник быстро выполняет поставленные задачи. После скачивания программы, можно придумать главное высказывание, которое дает сигнал работы.
Горыныч
Отечественная разработка голосового помощника, для управления ПК операционной системы Windows 7, XP, Vista. Размер 30,4 мб. Язык русский и английский. В основе идеи лежит приложение «Dragon Dictate», которое создано западными специалистами. Голосовой помощник выполняет все среднестатистические команды, которые выполняют его аналоги. С помощью голоса, пользователь может открывать любые папки в компьютере. Эта функция подобна функции из программы Typle. Особенностью голосового помощника «Горыныч» считается ввод текста в Word с помощью собственного голоса. Минус подобной функции в том, что речь пользователя должна быть без дефектов и четкой. Со временем программа запоминает голос владельца компьютера и начинает быстрее выполнять команды.
Speaker – голосовой помощник и программное обеспечение, которое используется в операционной системе Windows. Программное обеспечение отличается от остальных более широким функционалом. Пользователь может открывать и закрывать различные папки на ПК, делать фото экрана. Для работы со «Speaker» необходимо иметь стабильное Интернет-соединение. Управление программой осуществляется с помощью клавиатуры, что не всегда удобно. Голосовая функция оставляет желать лучшего: обработка речи по времени занимает 5 секунд, что долго. Программа преобразует речь в текст.
Ok Google для ПК
Siri на компьютер
С помощью эмулятора можно установить на Windows 7-10, размер файла 79 Мб. Программа преобразовывает речь человека, впоследствии давая пользователю рекомендации. Американский ассистент может выполнять простые команды, подобно другим. Отлично «понимает» русскую речь. Для работы необходимо подключение к интернету.
Если вас интересует, как помочь обездвиженному человеку управлять компьютером для общения с внешним миром – вам сюда. Если вам интересно, какое отношение к этому имеют мел-частотные кепстральные коэффициенты и нейронные сети – вам тоже сюда.
Часть I. Программа для управления компьютером при помощи голоса
Ко мне обратился человек с просьбой написать программу, которая позволила бы управлять компьютерной мышью при помощи голоса. Тогда я и представить себе не мог, что, практически полностью парализованный человек, который даже не может сам повернуть голову, а может лишь разговаривать, способен развить бурную деятельность, помогая себе и другим жить активной жизнью, получать новые знания и навыки, работать и зарабатывать, общаться с другими людьми по всему свету, участвовать в конкурсе социальных проектов.
Позволю себе привести здесь пару ссылок на сайты, автором и/или идейным вдохновителем которых является этот человек – Александр Макарчук из города Борисов, Беларусь:
Это одному мне режет глаз?
Программа была сделана в 2005-2009 годах и хорошо работала на Windows XP. В более свежих версиях Windows программа может зависнуть, что неприемлемо для человека, который не может встать со стула и её перезапустить. Поэтому программу нужно было переделать.
Исходных текстов нет, есть только отдельные публикации, приоткрывающие технологии, на которых она основана (MFCC, MLP – читайте об этом во второй части).
По образу и подобию была написана новая программа (месяца за три).
Собственно, посмотреть, как она работает, можно здесь:
Никаких особенных действий для установки программы выполнять не надо, просто щёлкаете на ней, да запускаете. Единственное, в некоторых случаях требуется, чтобы она была запущена от имени администратора (например, при работе с виртуальной клавиатурой “Comfort Keys Pro”):
Пожалуй, стоит упомянуть здесь и о других вещах, которые я ранее делал для того, чтобы можно было управлять компьютером без рук.
Если у вас есть возможность поворачивать голову, то хорошей альтернативой eViacam может послужить гироскоп, крепящийся к голове. Вы получите быстрое и точное позиционирование курсора и независимость от освещения.
Если вы можете двигать только зрачками глаз, то можно использовать трекер направления взгляда и программу к нему (могут быть сложности, если вы носите очки).
Часть II. Как это устроено?
Из опубликованных материалов о программе «Vocal Joystick» было известно, что работает она следующим образом:
- Нарезка звукового потока на кадры по 25 миллисекунд с перехлёстом по 10 миллисекунд
- Получение 13 кепстральных коэффициентов (MFCC) для каждого кадра
- Проверка того, что произносится один из 6 запомненных звуков (4 гласных и 2 согласных) при помощи многослойного персептрона (MLP)
- Воплощение найденных звуков в движение/щелчки мыши
Последняя задача просто реализуется при помощи функции SendInput.
Наибольший же интерес, мне кажется, представляют вторая и третья задачи. Итак.
Задача №2. Получение 13 кепстральных коэффициентов
Если кто не в теме – основная проблема узнавания звуков компьютером заключается в следующем: трудно сравнить два звука, так как две непохожие по очертанию звуковые волны могут звучать похоже с точки зрения человеческого восприятия.
И среди тех, кто занимается распознаванием речи, идёт поиск «философского камня» — набора признаков, которые бы однозначно классифицировали звуковую волну.
Из тех признаков, что доступны широкой публике и описаны в учебниках, наибольшее распространение получили так называемые мел-частотные кепстральные коэффициенты (MFCC).
Но человек устроен так, что он склонен использовать то, что ему лучше знакомо. И тем, кто занимался речевыми сигналами, пришло в голову использовать уже готовое компактное представление сигнала в виде MFCC. Оказалось, что, в общем, работает. (Один мой знакомый, специалист по вентиляционным системам, когда я его спросил, как бы сделать дачную беседку, предложил использовать вентиляционные короба. Просто потому, что их он знал лучше других строительных материалов).
Являются ли MFCC хорошим классификатором для звуков? Я бы не сказал. Один и тот же звук, произнесённый мною в разные микрофоны, попадает в разные области пространства MFCC-коэффициентов, а идеальный классификатор нарисовал бы их рядом. Поэтому, в частности, при смене микрофона вы должны заново обучать программу.
Это всего лишь одна из проекций 13-мерного пространства MFCC в 3-мерное, но и на ней видно, что я имею в виду – красные, фиолетовые и синие точки получены от разных микрофонов: (Plantronix, встроенный массив микрофонов, Jabra), но звук произносился один.
Однако, поскольку ничего лучшего я предложить не могу, также воспользуюсь стандартной методикой – вычислением MFCC-коэффициентов.
Чтобы не ошибиться в реализации, в первых версиях программы в качестве основы был использован код из хорошо известной программы CMU Sphinx, точнее, её реализации на языке C, именующейся pocketsphinx, разработанной в Университете Карнеги-Меллона (мир с ними обоими! (с) Хоттабыч).
Исходные коды pocketsphinx открыты, да вот незадача – если вы их используете, то должны в своей программе (как в исходниках, так и в исполняемом модуле) прописать текст, содержащий, в том числе, следующее:
Мне это показалось неприемлемым, и пришлось код переписать. Это сказалось на быстродействии программы (в лучшую сторону, кстати, хотя «читабельность» кода несколько пострадала). Во многом благодаря использованию библиотек “Intel Performance Primitives”, но и сам кое-что оптимизировал, вроде MEL-фильтра. Тем не менее, проверка на тестовых данных показала, что получаемые MFCC-коэффициенты полностью аналогичны тем, что получаются при помощи, например, утилиты sphinx_fe.
В программах sphinxbase вычисление MFCC-коэффициентов производится следующими шагами:
Шаг | Функция sphinxbase | Суть операции |
---|---|---|
1 | fe_pre_emphasis | Из текущего отсчёта вычитается большая часть предыдущего отсчета (например, 0.97 от его значения). Примитивный фильтр, отбрасывающий нижние частоты. |
2 | fe_hamming_window | Окно Хемминга – вносит затухание в начале и конце кадра |
3 | fe_fft_real | Быстрое преобразование Фурье |
4 | fe_spec2magnitude | Из обычного спектра получаем спектр мощности, теряя фазу |
5 | fe_mel_spec | Группируем частоты спектра [например, 256 штук] в 40 кучек, используя MEL-шкалу и весовые коэффициенты |
6 | fe_mel_cep | Берём логарифм и применяем DCT2-преобразование к 40 значениям из предыдущего шага. Оставляем первые 13 значений результата. Есть несколько вариантов DCT2 (HTK, legacy, классический), отличающихся константой, на которую мы делим полученные коэффициенты, и особой константой для нулевого коэффициента. Можно выбрать любой вариант, сути это не изменит. |
В эти шаги ещё вклиниваются функции, которые позволяют отделить сигнал от шума и от тишины, типа fe_track_snr, fe_vad_hangover, но нам они не нужны, и отвлекаться на них не будем.
Были выполнены следующие замены для шагов по получению MFCC-коэффициентов:
Шаг | Функция sphinxbase | Переделка |
---|---|---|
1 | fe_pre_emphasis | cas_pre_emphasis (через frame[i] -= frame[i — 1] * pre_emphasis_alpha;) |
2 | fe_hamming_window | for(i=0;i<MM_SOUND_BUFFER_LEN;i++) buf_in[i]*=(0.53836-0.46164*cos(2*3.14159*i/(MM_SOUND_BUFFER_LEN-1))); |
3 | fe_fft_real | ippsDFTFwd_RToCCS_32f |
4 | fe_spec2magnitude | for(i=0;i<=DFT_SIZE/2;i++) buf_ipp[i]=buf_ipp[i*2]*buf_ipp[i*2]+buf_ipp[i*2+1]*buf_ipp[i*2+1]; |
5 | fe_mel_spec | cas_mel_spec (через предрасчитанную таблицу) |
6 | fe_mel_cep | CS_mel_cep (через логарифм + ippsDCTFwd_32f_I) |
Что же дальше? У нас есть вектор 13-мерного пространства. Как определить, к какому звуку он относится?
Задача №3. Проверка того, что произносится один из 6 запомненных звуков
В программе-оригинале «Vocal Joystick» для классификации использовался многослойный персептрон (MLP) – нейронная сеть без новомодных наворотов.
Давайте посмотрим, насколько оправдано применение нейронной сети здесь.
Вспомним, что делают нейроны в искусственных нейронных сетях.
Если у нейрона N входов, то нейрон делит N-мерное пространство пополам. Рубит гиперплоскостью наотмашь. При этом в одной половине пространства он срабатывает (выдаёт положительный ответ), а в другой – не срабатывает.
Давайте посмотрим на [практически] самый простой вариант – нейрон с двумя входами. Он, естественно, будет делить пополам двумерное пространство.
Пусть на вход подаются значения X1 и X2, которые нейрон умножает на весовые коэффициенты W1 и W2, и добавляет свободный член C.
Итого, на выходе нейрона (обозначим его за Y) получаем:
(опустим пока тонкости про сигмоидальные функции)
Считаем, что нейрон срабатывает, когда Y>0. Прямая, заданная уравнением 0=X1*W1+X2*W2+C как раз и делит пространство на часть, где Y>0, и часть, где Y<0.
Проиллюстрируем сказанное конкретными числами.
Пусть W1=1, W2=1, C=-5;
Теперь посмотрим, как нам организовать нейронную сеть, которая бы срабатывала на некоторой области пространства, условно говоря – пятне, и не срабатывала во всех остальных местах.
Из рисунка видно, что для того, чтобы очертить область в двумерном пространстве, нам потребуется по меньшей мере 3 прямых, то есть 3 связанных с ними нейрона.
Эти три нейрона мы объединим вместе при помощи ещё одного слоя, получив многослойную нейронную сеть (MLP).
А если нам нужно, чтобы нейронная сеть срабатывала в двух областях пространства, то потребуется ещё минимум три нейрона (4,5,6 на рисунках):
И тут уж без третьего слоя не обойтись:
А третий слой – это уже почти Deep Learning…
Теперь обратимся за помощью к ещё одному примеру. Пусть наша нейронная сеть должна выдавать положительный ответ на красных точках, и отрицательный – на синих точках.
Если бы меня попросили отрезать прямыми красное от синего, то я бы сделал это как-то так:
Но нейронная сеть априори не знает, сколько прямых (нейронов) ей понадобится. Этот параметр надо задать перед обучением сети. И делает это человек на основе… интуиции или проб и ошибок.
Если мы выберем слишком мало нейронов в первом слое (три, например), то можем получить вот такую нарезку, которая будет давать много ошибок (ошибочная область заштрихована):
Но даже если число нейронов достаточно, в результате тренировки сеть может «не сойтись», то есть достигнуть некоторого стабильного состояния, далёкого от оптимального, когда процент ошибок будет высок. Как вот здесь, верхняя перекладина улеглась на два горба и никуда с них не уйдёт. А под ней большая область, порождающая ошибки:
Снова, возможность таких случаев зависит от начальных условий обучения и последовательности обучения, то есть от случайных факторов:
— Что ты думаешь, доедет то колесо, если б случилось, в Москву или не доедет?
— А ты как думаешь, сойдётся ента нейронная сеть или не сойдётся?
Есть ещё один неприятный момент, связанный с нейронными сетями. Их «забывчивость».
Если начать скармливать сети только синие точки, и перестать скармливать красные, то она может спокойно отхватить себе кусок красной области, переместив туда свои границы:
Если у нейронных сетей столько недостатков, и человек может провести границы гораздо эффективнее нейронной сети, зачем же их тогда вообще использовать?
А есть одна маленькая, но очень существенная деталь.
Я очень хорошо могу отделить красное сердечко от синего фона отрезками прямых в двумерном пространстве.
Я неплохо смогу отделить плоскостями статую Венеры от окружающего её трёхмерного пространства.
Но в четырёхмерном пространстве я не смогу ничего, извините. А в 13-мерном — тем более.
А вот для нейронной сети размерность пространства препятствием не является. Я посмеивался над ней в пространствах малой размерности, но стоило выйти за пределы обыденного, как она меня легко уделала.
Тем не менее вопрос пока открыт – насколько оправдано применение нейронной сети в данной конкретной задаче, учитывая перечисленные выше недостатки нейронных сетей.
Забудем на секунду, что наши MFCC-коэффициенты находятся в 13-мерном пространстве, и представим, что они двумерные, то есть точки на плоскости. Как в этом случае можно было бы отделить один звук от другого?
Пусть MFCC-точки звука 1 имеют среднеквадратическое отклонение R1, что [грубо] означает, что точки, не слишком далеко отклоняющиеся от среднего, наиболее характерные точки, находятся внутри круга с радиусом R1. Точно так же точки, которым мы доверяем у звука 2 находятся внутри круга с радиусом R2.
Внимание, вопрос: где провести прямую, которая лучше всего отделяла бы звук 1 от звука 2?
Напрашивается ответ: посередине между границами кругов. Возражения есть? Возражений нет.
Исправление: В программе эта граница делит отрезок, соединяющий центры кругов в соотношении R1:R2, так правильнее.
Далее, представим, что звука три. В этом случае проведём границы между каждой парой звуков.
И, наконец, не забудем, что где-то в пространстве есть точка, которая является представлением полной тишины в MFCC-пространстве. Нет, это не 13 нулей, как могло бы показаться. Это одна точка, у которой не может быть среднеквадратического отклонения. И прямые, которыми мы отрежем её от наших трёх звуков, можно провести прямо по границам окружностей:
На рисунке ниже каждому звуку соответствует кусок пространства своего цвета, и мы можем всегда сказать, к какому звуку относится та или иная точка пространства (или не относится ни к какому):
Ну, хорошо, а теперь вспомним, что пространство 13-мерное, и то, что было хорошо рисовать на бумаге, теперь оказывается тем, что не укладывается в человеческом мозгу.
Так, да не так. К счастью, в пространстве любой размерности остаются такие понятия, как точка, прямая, [гипер]плоскость, [гипер]сфера.
Мы повторяем все те же действия и в 13-мерном пространстве: находим дисперсию, определяем радиусы [гипер]сфер, соединяем их центры прямой, рубим её [гипер]плоскостью в точке, равно отдалённой от границ [гипер]сфер.
Никакая нейронная сеть не сможет более правильно отделить один звук от другого.
Здесь, правда, следует сделать оговорку. Всё это справедливо, если информация о звуке – это облако точек, отклоняющихся от среднего одинаково во всех направлениях, то есть хорошо вписывающееся в гиперсферу. Если бы это облако было фигурой сложной формы, например, 13-мерной изогнутой сосиской, то все приведённые выше рассуждения были бы не верны. И возможно, при правильном обучении, нейронная сеть смогла бы показать здесь свои сильные стороны.
Но я бы не рисковал. А применил бы, например, наборы нормальных распределений (GMM), (что, кстати и сделано в CMU Sphinx). Всегда приятнее, когда ты понимаешь, какой конкретно алгоритм привёл к получению результата. А не как в нейронной сети: Оракул, на основе своего многочасового варения бульона из данных для тренировки, повелевает вам принять решение, что запрашиваемый звук – это звук №3. (Меня особенно напрягает, когда нейронной сети пытаются доверить управление автомобилем. Как потом в нестандартной ситуации понять, из-за чего машина повернула влево, а не вправо? Всемогущий Нейрон повелел?).
Но наборы нормальных распределений – это уже отдельная большая тема, которая выходит за рамки этой статьи.
Надеюсь, что статья была полезной, и/или заставила ваши мозговые извилины поскрипеть.
Для людей с ограниченными возможностями, а также просто для сибаритов, разработчики ОС создали голосовое управление компьютером. Оно позволяет пользователю вводить информацию при помощи голоса. После проговаривания определенных слов устройство начинает распознавание речи - преобразование звукового сигнала в цифровую информацию. После того, как введенная информация будет корректно распознана – программа переходит к заданному алгоритму действия – выполняет функцию, которая прикреплена к той или иной команде.
Все достаточно просто. Не всегда речь распознается корректно, поэтому для решения сложных задач по управлению операционной системой программа голосового управления компьютером интенсивно не используется. Она применяется для выполнения основных функций: открытия и закрытия файлов, локального и сетевого поиска и пр.
История развития голосового управления
- Первая система распознавания голоса Audrey была создана в 50-х годах ХХ века. Она расшифровывала лишь цифры, проговоренные одним голосом.
- В 1962 г была создана первая система распознавания слов. Она расшифровывала 15 англоязычных слов.
- С развитием компьютеров в 1990 г была разработана программа Dragon Dictate. Она распознавала до 100 слов в минуту, но отличалась высокой ценой.
- В начале 2000-х годов в iPhone появилось приложение для распознавания речи Google Voice Search. В 2010 году была добавлена система поиска в Android.
- Siri была включена в программное обеспечение Phone 4S в начале октября 2011 г;
- в 2014 г была представлена Cortana - голосовая помощница для Windows.
Возможности Cortana и голосового ввода на сегодняшний день
«Кортана» - это виртуальный помощник в операционной системе Windows. Сервис помогает пользователю в планировании дел, напоминает о них.
При определенном запросе сервис поможет собрать конкретную информацию, создать четкую структуру и преподнести ее пользователю в максимально возможно обработанном виде.
Интересно, что сразу при включении виртуальный помощник собирает всю информацию о введенных запросах, личных данных, пытаясь максимально адаптироваться под каждого отдельного пользователя.
Голосовое управление компьютером Windows 7 посредством использования виртуального помощника невозможно – он интегрирован только в десятую версию. Но, как ни жаль, разработчики не удосужились выпустить русскоязычную версию.
Главную роль отыгрывает поиск, который в 10-ке можно открыть через «Пуск». Эта функция определяет практически любые запросы. Если вхождение не распознано – можно ввести соответствующую команду во всплывающее окно и программа голосового управления компьютером считает текстовую информацию.
Неприятный момент – сбор всех данных, введенных через клавиатуру, и их отправка в «Майкрософт».
Сторонние программы
Typle
После выполнения установки переходим к следующему шагу – создаем учетную запись. Здесь необходимо придумать ключевую фразу, после чего прозвучит уведомление об активации.
Дальше нужно будет придумать и создать голосовые команды, независимо от их предназначения. Команда «собака» может запускать приложение или выполнять совсем другое действие.
Просто нужно создать голосовую команду и закрепить ее за определенным действием. Подойдет только для выполнения базовых операций – открытия файлов, папок и пр. Функционал ограничен.
Speaker
Здесь функционал более широкий, нежели в Typle.
Голосовое управление компьютером Windows 10 предоставляет пользователю возможность открывать и закрывать файлы, делать снимки состояния экрана, выключать ПК.
Распознавание речи происходит довольно долго, свыше 3-4 секунд. Это обусловлено тем, что сначала речь преобразуется в текст, а команды распознаются компьютером уже с текстовой информации.
Laitis
Это бесплатная программа, которая позволяет как управлять ПК, так и диктовать текст. После установки необходимо зарегистрироваться и дальше можно пользоваться в свое удовольствие.
Интересна функция автозамены при наборе текста. Вы можете сказать «Кавычки» и в тексте появится соответствующий символ.
Возможности управления голосом через Яндекс.строку
Появилась возможность выполнять голосовое управление компьютером при помощи приложения Яндекс.строка.
Посредством использования этого приложения можно выполнять локальный или сетевой поиск информации и файлов, перезагрузить или выключить компьютер. Присутствует функция открытия программ и сайтов.
Чтобы воспользоваться программой, необходимо сначала скачать и установить ее.
Но при установке стоит убрать галочки напротив пунктов, где производитель софта предлагает установить браузер, поменять его настройки. В противном случае установка займет больше время и в браузере изменится конфигурация.
В конечном итоге строка размещается около кнопки «Пуск». Скажите «Слушай Яндекс» и откроется окно.
Проговорите запрос.
После паузы в браузере откроется строка поиска. Занимательно управлять поиском таким образом.
В целом, голосовое управление компьютером пока не развито, так как рисуется нам в воображении. Но и те функции, что имеются на сегодняшний день, уже впечатляют и существенно помогают перейти на новый уровень пользования ПК.
Есть несколько причин, по которым люди прибегают к использованию голосового управления компьютером.
Во-первых, такое решение может быть связанно с поломкой мыши или клавиатуры.
Обзор программы Typle
Во-вторых, благодаря голосовому помощнику полноценно могут пользоваться люди с ограниченными возможностями.
В-третьих, голосовое управление компьютером значительно облегчает работу с поисковыми системами, отдавая команды голосом. Для того, чтобы голосовое управление работало, следует совершить следующее:
- Настроить микрофон
- Пройти обучение программы
- Установить саму программу
Для того, чтобы провести настройку систем для голосового управления компьютером, нужно сделать следующее:
- В меню «пуск» следует открыть «панель управления» и найти там пункт «распознавание речи».
- Для настройки микрофона нужно зайти в раздел «настройки микрофона»
- Следующим пунктом будет настройка «речевого учебника». Его также ищем в разделе «распознавание речи».
Подробности об установке Типл
По умолчанию в операционной системе
Windows присутствует голосовой помощник, но, к сожалению, стандартная система распознавания речи не поддерживает русский язык, поэтому для пользователей из России и СНГ, очень удобным приложением станет Typle.
Одной из самых популярных программ для голосового управления компьютером является программа Typle. По оценкам пользователей, она находится в топе лидеров, если не самой лучшей. Огромным преимуществом является то, что она абсолютно бесплатная.
Программа Тyple – весьма удобная система управления компьютером лишь посредством голоса. Кроме того, есть возможность настроить программу таким образом, чтобы система работала на определенные запросы. При этом подключать дополнительные устройства нет необходимости.
Данное приложение является очень лёгким в управлении
и не имеет никаких ограничений в плане запросов. Для того, чтобы получить информацию, необходимо выбрать файл и при помощи голоса совершить некие действия. После проделанных шагов программа распознает запрос и выводит на экран найденный в сети материал. Программа Typle имеет гибкий интерфейс, который можно настраивать в зависимости от личных предпочтений. Абсолютно любую введенную информацию можно изменить.
Особенности программы Typle:
- Голосовое управление компьютером;
- Отличное распознавание голосовых команд;
- Простое управление;
- Удобный настраиваемый интерфейс;
- Большое количество полезных настроек;
Продолжительность ключевого слова, указанного в запросе, не должна превышать полутора секунд. Кроме того, не имеет значения, на каком языке будет дан запрос, система с легкостью и быстротой найдет нужную информацию, такая возможность появилась благодаря собственной уникальной системе распознавания.
Установка программы
В процессе установки программы у вас попросят ввести кое-какие личные данные. Ввести можно абсолютно любые символы. Далее последует выбор лицензии, каждая из лицензий на английском языке. После проделанной работы нажмите «далее»
Как пользоваться программой?
При запуске программы нас сразу же поприветствует система и предложит начать с ней работать. Далее программа предложит нажать на кнопку «добавить». В данную строку следует записать ключевое слово запроса, а позже произнести его в микрофон. После этого система автоматически сохранит запрос, благодаря чему в дальнейшем вы сможете говорить любые другие слова.
Следующим действием работы с программой будет добавление команд. Для того, чтобы добавить команды, необходимо нажать на кнопку «добавить +»
После следует произнести сам запрос, и нажать добавить.
Ко всем уже вышеуказанным особенностям можно добавить то, что при помощи Typle можно открывать избранные сайты. Для этого необходимо в настройках приложения поставить галочку рядом с пунктом «Фавориты Интернета» и выбрать нужные вам сайты.
Программа не всегда может работать на 100%. Иногда могут быть сбои в распознавании голоса или запроса, но такое происходит лишь с русской версией приложения, так как великий русский язык не до конца внесен в базу приложения.
На сегодняшний день программа является очень старой, и скачать ее с официального источника не получится. В основном, инсталлятор приложения весит 620кб. Так что трудностей с освобождением памяти не будет. Стоит отметить, что программа запускается на любой операционной системе Windows.
Читайте также: