Как работает приложение алиса
Алиса — это голосовой помощник, который устанавливается в Яндекс.Браузер . Она поможет вам найти нужную информацию в интернете, расскажет о новостях и погоде, включит музыку, запустит программу или просто поболтает с вами на произвольную тему.
Алиса также доступна в мобильном Яндекс.Браузере на устройствах с Android и iOS и в приложении Яндекс на базе Android.
Алиса и ваши персональные данные
Когда вы используете сервисы Яндекса, вы оставляете в них свои данные, например историю запросов к Алисе. Мы бережно храним эти данные и хорошо их защищаем: все наши хранилища соответствуют SOC 2 — это один из самых надежных международных стандартов.
Управлять персональными данными можно на странице Ваши данные на Яндексе.
Откройте страницу Ваши данные на Яндексе и авторизуйтесь (каждый раз при входе требуется подтверждать номер телефона — это необходимо для безопасности ваших персональных данных). Откройте страницу Ваши данные на Яндексе и авторизуйтесь (каждый раз при входе требуется подтверждать номер телефона — это необходимо для безопасности ваших персональных данных). Выберите сервис и тип данных, которые хотите удалить.После удаления почти все данные сразу станут недоступны. Некоторые виды данных Яндекс будет хранить еще какое-то время, потому что этого требует закон.
","lang":>,"extra_meta":[>,>,>,>,>,>,>,>,>,>,>,>,>,>,>,>,>,>,>,>,>,>,>,>,>,>],"title":"Голосовой помощник Алиса - Яндекс.Браузер. Справка","canonical":"https://browser.yandex.ru/help/alice/alice.html","productName":"Яндекс.Браузер","extra_js":[[,"mods":,"__func137":true,"tag":"script","bem":false,"attrs":,"__func67":true>],[,"mods":,"__func137":true,"tag":"script","bem":false,"attrs":,"__func67":true>],[,"mods":,"__func137":true,"tag":"script","bem":false,"attrs":,"__func67":true>]],"extra_css":[[],[,"mods":,"__func69":true,"__func68":true,"bem":false,"tag":"link","attrs":>],[,"mods":,"__func69":true,"__func68":true,"bem":false,"tag":"link","attrs":>]],"csp":<"script-src":[]>,"lang":"ru">>>'>"current":"ru","available":["ru"]>Зачем нужна Алиса
Ограничение. Алиса доступна только в Яндекс.Браузере для Windows и только на русском языке.Алиса — это голосовой помощник, который устанавливается в Яндекс.Браузер . Она поможет вам найти нужную информацию в интернете, расскажет о новостях и погоде, включит музыку, запустит программу или просто поболтает с вами на произвольную тему.
Алиса также доступна в мобильном Яндекс.Браузере на устройствах с Android и iOS и в приложении Яндекс на базе Android.
Алиса и ваши персональные данные
Когда вы используете сервисы Яндекса, вы оставляете в них свои данные, например историю запросов к Алисе. Мы бережно храним эти данные и хорошо их защищаем: все наши хранилища соответствуют SOC 2 — это один из самых надежных международных стандартов.
Управлять персональными данными можно на странице Ваши данные на Яндексе.
В этом обзоре мы разберемся, как Алиса работает – расскажем о действующих алгоритмах, которые лежат в основе голосового помощника. Также мы рассмотрим основные возможности приложения – эта информация пригодится как новым пользователям, так и тем, кто давно пользуется ботом, но хочет узнать о нем больше.
Принцип работы
Для начала, расскажем, как работает голосовой помощник Алиса. Она была запущена Яндексом в октябре 2017 года и функционирует с использованием интеллектуальных алгоритмов обработки запроса.
В основе лежит платформа SpeechKit , позволяющая распознавать и синтезировать речь. Как работает Алиса в Яндекс.Браузере или на устройствах? Разработчики отмечают, что для этого была проделана огромная работа, поддержка диалогов без использования заданных сценариев стала возможной с помощью нейронных сетей и других современных технологий машинного обучения, как понимаете, это очень тонкий и сложный процесс. Включи Алису в Яндексе и посмотри как это — работать с помощью интеллектуальной помощницы.
Теперь ты знаешь, как работает Алиса в фоновом режиме.
Обращаем твое внимание, что бот находится в постоянном процессе обучения с целью улучшения своей функциональности. Так , например, сейчас помощница может давать наиболее полные и развернутые ответы, в отличие от тех, что были год назад!
Помочь ей стать умнее может каждый – реагируйте на ответы с помощью иконок с поднятым или опущенным пальцем и выбирайте варианты ответа.
Теперь давайте кратко рассмотрим основные возможности, которыми обладает робот.
Основные возможности
Помощник создан специально для улучшения и оптимизации ежедневных рабочих процессов каждого человека – он экономит время и позволяет снять с пользователя некоторые обязанности.
Программа Алиса работает с помощью отправки запросов, которые делаются:
- В письменном виде;
- В голосовом формате.
После запроса можно начинать пользоваться основными функциями программы, которых у нее великое множество. Мы расскажем тебе об основных возможностях:
- Прогноз погоды;
- Курс валют;
- Ответ на вопрос;
- Действия калькулятора;
- Сколько времени и какое сегодня число;
- Анекдоты и шутки;
- Установка будильника;
- Поиск информации;
- Игры;
- Беседа на отвлеченные темы;
- Вызов такси;
- Заказ еды и многое другое.
Навыки
С появлением навыков, помощница научилась делать еще больше разнообразных вещей, например:
Чтобы получить ответ, выбирай фразу, содержащую в себя максимальное количество точно сформулированной информации.
Например, чтобы узнать прогноз на завтра в Санкт-Петербурге, произнеси «Погода завтра в СПб». Также ты сам можешь воспользоваться конструктором навыков для Алисы и создать свой собственный проект для помощницы.
В отдельной статье на нашем сайте ты можешь прочитать про все доступные команды.
Теперь ты знаком с тем, как работает приложение Алиса на компьютере и на телефоне и можешь понять, какие процессы лежат в основе уникального искусственного интеллекта. Пользуйся ботом, расширяй его функционал и упрощай свои повседневные дела с помощью легкого управления.
В этой лекции впервые рассматриваются технологические решения, на основе которых работает Алиса — голосовой помощник Яндекса. Руководитель группы разработки диалоговых систем Борис Янгель hr0nix рассказывает, как его команда учит Алису понимать желания пользователя, находить ответы на самые неожиданные вопросы и при этом вести себя прилично.
— Я расскажу, что внутри у Алисы. Алиса большая, в ней много компонент, поэтому я немного поверхностно пробегусь.
Алиса — голосовой помощник, запущенный Яндексом 10 октября 2017 года. Она есть в приложении Яндекса на iOS и Android, а также в мобильном браузере и в виде отдельного приложения под Windows. Там можно решать свои задачи, находить информацию в формате диалога, общаясь с ней текстом или голосом. И есть киллер-фича, которая сделала Алису довольно известной в рунете. Мы пользуемся не только заранее известными сценариями. Иногда, когда мы не знаем, что делать, мы используем всю мощь deep learning, чтобы сгенерировать ответ от имени Алисы. Это получается довольно забавно и позволило нам оседлать поезд хайпа.
Как выглядит Алиса высокоуровнево?
Пользователь говорит: «Алиса, какую ожидать завтра погоду?»
Первым делом мы его речь стримим в сервер распознавания, он превращает ее в текст, и этот текст затем попадает в сервис, разработкой которого занимается моя команда, в такую сущность, как классификатор интентов. Это машиннообученная штука, задача которой — определить, чего же пользователь хотел сказать своей фразой. В этом примере классификатор интентов мог сказать: окей, наверное, пользователю нужна погода.
В основе концепции Dialog Manager лежит концепция, известная тем, кто занимается диалоговыми системами, как form-filling. Идея в том, что пользователь своими репликами как бы заполняет некую виртуальную форму, и когда он в ней заполнит все обязательные поля, его потребность можно удовлетворить. Движок event-driven: каждый раз, когда пользователь что-то делает, происходят какие-то события, на которые можно подписываться, писать их обработчики на Python и таким образом конструировать логику диалога.
Когда нужно в сценариях сгенерировать фразу — например, мы знаем, что пользователь говорит про погоду и нужно ответить про погоду, — у нас есть мощный язык шаблонов, который позволяет нам эти фразы писать. Вот так это выглядит.
Это надстройка над питонячьим шаблонизатором Jinja2, в которую добавили всякие лингвистические средства, например возможности склонять слова или согласовывать числительные и существительные, чтобы можно было легко когерентный текст писать, рандомизировать кусочки текста, чтобы увеличивать вариативность речи Алисы.
В классификаторе интентов мы успели попробовать множество разных моделей, начиная от логистической регрессии и заканчивая градиентным бустингом, рекуррентными сетями. В итоге остановились на классификаторе, который основан на ближайших соседях, потому что он обладает кучей хороших свойств, которых у других моделей нет.
Например, вам часто надо иметь дело с интентами, для которых у вас есть буквально несколько примеров. Просто учить обычные классификаторы мультиклассовые в таком режиме невозможно. Например, у вас оказывается, что во всех примерах, которых всего пять, была частица «а» или «как», которой не было в других примерах, и классификатор находит самое простое решение. Он решает, что если встречается слово «как», то это точно этот интент. Но это не то, чего вы хотите. Вы хотите семантической близости того, что сказал пользователь, к фразам, которые лежат в трейне для этого интента.
В итоге мы предобучаем метрику на большой датасете, которая говорит о том, насколько семантически близки две фразы, и потом уже пользуемся этой метрикой, ищем ближайших соседей в нашем трейнсете.
Еще хорошее качество этой модели, что ее можно быстро обновлять. У вас появились новые фразы, вы хотите посмотреть, как изменится поведение Алисы. Все, что нужно, это добавить их множество потенциальных примеров для классификатора ближайших соседей, вам не нужно переподбирать всю модель. Допустим, для нашей рекуррентной модели это занимало несколько часов. Не очень удобно ждать несколько часов, когда вы что-то меняете, чтобы увидеть результат.
Семантический теггер. Мы пробовали conditional random fields и рекуррентные сети. Сети, конечно, работают намного лучше, это ни для кого не секрет. У нас там нет уникальных архитектур, обычные двунаправленные LSTM с attention, плюс-минус state-of-the-art для задачи тегирования. Все так делают и мы так делаем.
Единственное, мы активно пользуемся N-best гипотез, мы не генерируем только самую вероятную гипотезу, потому что иногда нам нужна не самая вероятная. Например, мы перевзвешиваем зачастую гипотезы в зависимости от текущего состояния диалога в dialog manager.
Если мы знаем, что на предыдущем шаге мы задали вопрос про что-то, и есть гипотеза, где теггер что-то нашел и гипотеза, где не нашел, то наверное, при прочих равных первое более вероятно. Такие трюки нам позволяют немного улучшить качество.
А еще машиннообученный теггер иногда ошибается, и не совсем точно в самой правдоподобной гипотезе находят значение слотов. В этом случае мы ищем в N-best гипотезу, которая лучше согласуется с тем, что мы знаем о типах слотов, это позволяет тоже еще немного качество заработать.
Еще в диалогах есть такое явление Анафора. Это когда вы с помощью местоимения ссылаетесь на какой-то объект, который был раньше в диалоге. Скажем, говорите «высота Эвереста», и потом «в какой стране он находится». Мы анафоры умеем разрешать. Для этого у нас две системы.
Одна general-purpose система, которая может работать на любых репликах. Она работает поверх синтаксического разбора всех пользовательских репликах. Если мы видим местоимение в его текущей реплике, мы ищем known phrases в том, что он сказал раньше, считаем для каждой из них скорость, смотрим, можно ли ее подставить вместо этого местоимения, и выбираем лучшую, если можем.
А еще у нас есть система разрешения анафор, основанная на form filling, она работает примерно так: если в предыдущем интенте в форме был геообъект, и в текущем есть слот для геообъекта, и он не заполнен, и еще мы в текущий интент попали по фразе с местоимением «туда», то наверное, можно предыдущий геообъект импортировать из формы и подставить сюда. Это простая эвристика, но производит неплохое впечатление и круто работает. В части интентов работает одна система, а в части обе. Мы смотрим, где работает, где не работает, гибко это настраиваем.
Есть эллипсис. Это когда в диалоге вы опускаете какие-то слова, потому что они подразумеваются из контекста. Например, вы можете сказать «расскажи погоду», а потом «а на выходных?», имея в виду «расскажи погоду на выходных», но вы хотите повторять эти слова, потому что это ни к чему.
С эллипсисами мы тоже умеем работать примерно следующим образом. Эллиптические фразы или фразы-уточнения — это отдельные интенты.
Если есть интент get_weather, для которого в трейне фразы типа «расскажи погоду», «какая сегодня погода», то у него будет парный интент get_weather_ellipsis, в котором всевозможные уточнения погоды: «а на завтра», «а на выходные», «а что там в Сочи» и так далее. И эти эллиптические интенты в классификаторе интентов на равных конкурируют со своими родителями. Если вы скажете «а в Москве?», классификатор интентов, например, скажет, что с вероятностью 0,5 это уточнение в интенте погода, и с вероятностью 0,5 уточнение в интенте поиска организаций, например. И затем диалоговый движок перевзвешивается scores, которые назначил классификатор интентов, который назначил их с учетом текущего диалога, потому что он, например, знает, что до этого шел разговор о погоде, и вряд ли это было уточнение про поиск организаций, скорее это про погоду.
Такой подход позволяет обучаться и определять эллипсисы без контекста. Вы можете просто откуда-то набрать примеров эллиптических фраз без того, что было раньше. Это довольно удобно, когда вы делаете новые интенты, которых нет в логах вашего сервиса. Можно или фантазировать, или чего-то придумывать, или пытаться на краудсорсинговой платформе собрать длинные диалоги. А можно легко насинтезировать для первой итерации таких эллиптических фраз, они будут как-то работать, и потом уже собирать логи.
Вот жемчужина нашей коллекции, мы называем ее болталкой. Это та самая нейросеть, которая в любой непонятной ситуации чего-то от имени Алисы отвечает и позволяет вести с ней зачастую странные и часто забавные диалоги.
Болталка — на самом деле fallback. В Алисе это работает так, что если классификатор интентов не может уверенно определить, чего хочет пользователь, то другой бинарный классификатор сперва пытается решить — может, это поисковый запрос и мы найдем что-то полезное в поиске и туда отправим? Если классификатор говорит, что нет, это не поисковый запрос, а просто болтовня, то срабатывает fallback на болталку. Болталка — система, которая получает текущий контекст диалога, и ее задача — сгенерировать максимально уместный ответ. Причем сценарные диалоги тоже могут являться частью контекста: если вы говорили про погоду, а потом сказали что-то непонятное, сработает болталка.
Это позволяет нам делать вот такие штуки. Вы спросили про погоду, а потом болталка ее как-то прокомментировала. Когда работает, выглядит очень круто.
Болталка — DSSM-подобная нейронная сеть, где есть две башни энкодера. Один энкодер кодирует текущий контекст диалога, другой — ответ-кандидат. У вас получается два embedding-вектора для ответа и контекста, и сеть обучается так, чтобы косинусное расстояние между ними было тем больше, чем уместнее данный ответ в контексте и чем неуместнее. В литературе эта идея давно известна.
Почему у нас вроде неплохо все работает — кажется, что чуть лучше, чем в статьях?
Никакой серебряной пули нет. Нет техники, которая позволит внезапно сделать классно разговаривающую нейронную сеть. Нам удалось достичь неплохого качества, потому что мы в качестве понемножку выиграли везде. Мы долго подбирали архитектуры этих башен-энкодеров, чтобы они лучше всего работали. Очень важно правильно подобрать схему сэмплирования отрицательных примеров в обучении. Когда вы обучаетесь на диалоговых корпусах, у вас есть только положительные примеры, которые когда-то кем-то были сказаны в таком контексте. А отрицательных нет — их нужно как-то генерировать из этого корпуса. Там есть много разных техник, и одни работают лучше, чем другие.
Важно, как вы выбираете ответ из топа кандидатов. Можно выбирать наиболее вероятный ответ, предлагаемый моделью, но это не всегда лучшее, что можно сделать, потому что при обучении модель учитывала не все характеристики хорошего ответа, которые существуют с продуктовой точки зрения.
Есть ряд дополнительных метрик, которые мы стараемся оптимизировать. Это когда Алиса к пользователю на «ты» обращается, говорит о себе в мужском роде и произносит всякие дерзости, гадости и глупости.
Яндекс выпустил голосовой помощник – Алису, которая помогает найти информацию в интернете, подсказать, что приготовить на ужин, какая ожидается погода и куда пойти пообедать. При этом не придется переключаться между сайтами – кибердевушка сама обратится к различным сервисам поисковой системы. А еще она обладает незаурядным чувством юмора и весьма непростым характером.
Принцип работы Алисы
За каждым ответом Алисы стоят сложные технологические процессы. Первое – распознавание речи. Искусственный интеллект должен понимать, что обращаются к нему. Решается это при помощи нейронной сети, обученной распознавать всего несколько предложений:
- «привет, Алиса»;
- «скажи, Алиса»;
- «слушай, Яндекс»;
Среди шума (некоторые ведь пользуются устройством на улице) Алиса должна уловить слова и определить их значения. Когда речь распознана, включается нейросеть, распознающая ключевые фразы. Это – самая тяжеловесная часть приложения, ведь для распознавания всего одной фразы необходимы десятки тысяч примеров. Так, человек не всегда говорит: «Погода в Москве 30 декабря 2019 года», скорее, он скажет: «Погода в Москве на завтра». Нейросеть должна обратиться к серверам за получением информации, какое сегодня число, какая дата завтра, к метеосводкам для распознавания погоды, передать эту информацию в облако, а уже оттуда получить сформированный ответ.
Алиса не только распознает речь, но и совершает определенные действия. На вопрос «Какая погода в Питере» помощник может ответить голосом, может выдать список сайтов с метеосводками, а может открыть приложение.
Алиса способна обучаться на основании тех поисковых запросов, которые делают люди в Яндексе. Так, на вопрос «Какая погода в Питере?», голосовой помощник даст точный ответ или уточнит – когда. Но не спросит, что это за город такой «Питер», потому что миллионы пользователей вводили подобный запрос в Яндексе. Сведения берутся именно из них. Благодаря сложной нейросети, Алиса понимает, что Питер – это Санкт-Петербург, а погоду ищут, скорее всего, на ближайшие дни.
Алиса умеет не только распознавать речь человека, но и говорить, как люди, а не роботы. Кибердевушка обладает приятным тембром Татьяны Шитовой, которая, кстати, озвучивала ИИ в фильме «Она». Актриса является официальным голосов Скарлетт Йохансен в России.
Яндекс глубоко синтезировал речь актрисы, а не нарезал готовые фразы. При этом Алиса способна не просто отвечать на вопросы, но и просто вести диалог, как живой человек.
Алиса – ребенок, которого невозможно научить не хамить, если это делают все окружающие. Если убрать из контекста обучающих материалов подобные фразы, то голосовой помощник будет очень похож на обычного робота.
Когда Алиса находится в режиме диалога, она может использовать любой из сценариев, не всегда вежливый. Но пользователям нравится именно это – живое общение.
Может ли Алиса работать оффлайн и почему?
Разработчики уже работают над данным вопросом. Так, уже существует Edge-поиск, работающий при медленном или отсутствии интернета.
Какой движок используется для обработки голосовых команд? Как это работает?
Голосовые запросы Алиса распознает при помощи технологии СпичКит. На данном этапе голос отделяется от остальных шумов. База знаний, накопленная Яндексом, позволяет голосовому помощнику распознать миллиарды фраз, произнесенных с разным акцентом и в разных условиях.
При помощи технологии Тьюринг Алиса наделяет вопрос смыслом и подбирает ответ. Озвучивание текста происходит с использование технологии Text-to-speech. Основа – записанные в студии сотни тысяч фраз, разбитых на звуки. Из базы Алиса собирает ответ, а нейросеть сглаживает интонации, приближая речь голосового помощника в человеческой.
Немного о нейронных сетях голосового ассистента
На данный момент Алиса использует 120-слойную нейросеть, позволяющую ей общаться, как человек.
Обучение на обратной связи
Технология Тьюринг позволяет разговаривать с пользователем на отвлеченные темы. Для максимально точного ответа, помощник умеет запоминать историю общения с ней, распознавать интонации запросов и учитывает геоположение пользователя.
Чтобы начать пользоваться Алисой в Яндексе, нужно установить браузер со встроенным ассистентом. Приложение работает через интернет и доступно для загрузки на официальном сайте Yandex.
Что такое голосовой помощник Алиса
Система от Яндекс представлена в виде браузера, в который встроен Ассистент. Благодаря искусственному интеллекту, Алиса понимает русскоязычную речь и выводит информацию с ответом.
Сервис работает с базами Яндекс, поэтому требуется постоянное подключение к интернету. Голос пользователя воспринимается через встроенный микрофон, а ответ дается в буквенном виде и воспроизводится через динамики.
Благодаря качественной записи голоса и нейронному управлению, Алиса произносит русскоязычные слова без запинок и неточностей. Голосовой помощник может спеть песню, рассказать о последних новостях, поддержать разговор, пошутить и даже обидеться.
Встроенные возможности
Алиса интегрируется во все установленные приложения от Yandex. Благодаря этому пользователь экономит личное время и управляет смартфоном, планшетом или компьютером с помощью голоса.
Что умеет Алиса от Яндекса:
NPAPI в Яндекс Браузере - как включить поддержку плагина
Важно. Перечисленные функции работают после инсталляции приложения. Полная версия доступна для скачивания бесплатно и не требует внутренних покупок. Для работы потребуется подключение к сети, рабочий микрофон и динамики.
Где скачать и какие системы поддерживает
Чтобы начать использовать голосовой помощник, его нужно установить в устройство. В настоящее время ассистент поддерживает следующие операционные системы:
Важно. Ассистент использует общие базы. При небольшом отличии в интерфейсе в зависимости от установленной операционной системы, Алиса обладает одинаковыми возможностями.
Голосовой помощник обновляется автоматически в фоновом режиме, не отвлекая пользователя от работы. В мобильных устройствах загрузка новых данных осуществляется по сети WiFi для экономии трафика.
При загрузке неофициальной версии из торрента или стороннего сайта возможны проблемы с обновлением, а также нестабильная работа. Полная версия с последними обновлениями всегда доступна на официальной странице и распространяется бесплатно.
Как пользоваться Алисой
Чтобы начать общаться с Алисой в Яндексе, не нужно выполнять сложных манипуляций и настраивать систему. Для активации нужно произнести одну из команд: «Привет Алиса», «Слушай Алиса» или нажать на кнопку микрофона.
После активации автоматически откроется окно с Ассистентом, а также дополнительной информацией о запросах. Для демонстрации возможностей при первом запуске не лишним будет спросить: «Что ты умеешь?».
Алиса может установить будильник. Для этого нужно произнести соответствующую команду, например: «Поставь будильник на завтра на 8 утра». Для управления системой не нужно заучивать команды для Алисы Яндекс, Ассистент понимает любой запрос и оперативно отвечает.
Важно. При установке на мобильное устройство система потребует предоставить разрешения на доступ во внутреннюю память, управление микрофоном, датчиком GPS, WiFi. Благодаря этому будут работать все вспомогательные и секретные функции.
Для просмотра подробной информации о возможностях и встроенных командах:
Для просмотра информации о том, как работает Алиса на компьютере, нужно перейти на официальный сайт Yandex. Новые возможности добавляются по несколько раз в месяц. Разработчики активно расширяют базы и внедряют удобные функции.
Возможные проблемы и способы их решения
При первом запуске голосового помощника, пользователи нередко сталкиваются с проблемами поиска и не понимают, как вызвать Алису. Если Ассистент не реагирует на команды, и не понимает речь, то, скорее всего, есть проблемы с микрофоном.
Для этого нужно проверить разрешения:
После выполненных настроек следует перезагрузить устройство.
Одной из частых проблем является потеря соединения с интернетом. В этом случае ассистент самостоятельно сообщит о неполадке. Для подключения интернета нужно потянуть шторку и нажать на иконку с WiFi или передачей сетевых данных.
Приложение от Яндекс работает стабильно и постоянно получает обновления. Скорость обработки запроса зависит от качества интернета и мощности оборудования.
Читайте также: