Что такое ассистент в телефоне
Перейти к содержимому

Что такое ассистент в телефоне

  • автор:

Голосовые ассистенты. Краткий обзор

Сегодня существует множество текстовых каналов связи (почта, месседжеры, социальные сети и др.), но пользователь иногда отдает предпочтение обычному звонку для передачи большого количества информации. А что будет, если он не дозвониться? Как правило, он пытается позвонить еще раз, и если звонящему это не удается, то он может просто забыть передать необходимую информацию или передать ее со значительной задержкой. И вот здесь на помощь приходит голосовой ассистент, который не только может пообщаться с абонентом, но и перевести его сообщение в текст и выслать конечному абоненту.

Конечно, данный инструмент нужен не всем, но если у человека высокая голосовая нагрузка или его день расписан по минутам, таким образом, у него нет времени чтобы ответить на звонок. В этом случае, голосовой ассистент – отличный помощник.

Сейчас абоненту мобильной связи доступны следующие голосовые ассистенты:

Из представленных сервисов, только Ева имеет ограничения по подключению (доступна только абонентам столичного филиала Мегафон). Яндекс, Сбербанк — позволяют подключиться к сервису любого оператора, но если вы используете их услуги (Яндекс — платная подписка “яндекс.плюс”, сбербанк – необходим личный кабинет в Сбербанке). У остальных ассистентов ограничений по подключению нет.

Стоимость услуги

Олег — является полностью бесплатным ассистентом без скрытых платежей. Переадресация не у абонентов Тинькофф Мобайл идет на бесплатный номер 8-800 (за переадресацию на номер 8-800 Билайн взимает плату по тарифу). При выезде за границу следует отключить переадресацию на другие номера, чтобы избежать списания значительных денежных средств в роуминге.

Салют — мы тоже можем отнести к полностью бесплатному сервису, но необходимо иметь личный кабинет в Сбербанке. Переадресация идет на бесплатный номер номер 8-800.

Ева — бесплатна только базовая версия. Если необходим расширенный функционал (бесплатен у других), то необходимо выбрать платного ассистента (стоимость от 2 рублей в день).

Алиса — необходима подписка Яндекс.Плюс стоимостью от 990 рублей в год. Переадресация идет на бесплатный номер 8-800.

Маша — достаточно сложная тарифная линейка, бесплатный тариф предлагает переадресацию на обычный номер 8-916, т.е. за переадресацию будет платить абонент (МТС берет плату только за первую минуту переадресации в сутки, т.е. получается, от 3 рублей в сутки) или платный тариф от 149 рублей в месяц с бесплатной переадресацией на номер 8-800. Дополнительно разработчик ограничивает в количестве звонков на ассистента (в бесплатной версии всего 50 звонков в месяц).

Кира — бесплатна для подключения, но переадресация идет на обычный городской номер (+7 495), т.е. ваш оператор будет списывать деньги со счета по вашему тарифу. МТС (московский регион) берет плату только за первую минуту переадресации в сутки, т.е. получается, от 3 рублей в сутки.

Настройка ассистента

Управление и настойка ассистентов Ева, Маша, Кира производиться через бот в телеграмме. Олега можно настроить через телеграмм, но для абонентов тинькофф мобайл настройка возможна только через приложение “Мобайл”. Настойка Алисы производится через приложение “Яндекс – с алисой”. Салют можно настроить через приложение Сбербанк онлайн (ограничен функционал по созданию индивидуальных правил к контактам из адресной книги) или Салют.

Одной из важных функций является возможность изменить представление ассистента, т.е. что бы ассистент называл ваше имя или организацию. Таким образом, звонящий будет уверен в том, кому он позвонил и не будет сразу бросать трубку. Данную настройку бесплатно позволяют сделать Олег, Алиса, Маша, Кира, Салют. А Ева позволяет это сделать только на платных тарифах. Стоит отметить Салют, он позволяет настроить правила приветствия индивидуально для каждого номера. Олег (для абонентов тинькофф мобайл) тоже позволяет сделать свое приветствие для всех контактов из адресной книги и для незнакомых абонентов.

Ведем диалог

Из личного опыта отмечу, что если ассистент не представляется сразу, то может состоятся полноценный диалог. Самым забавным, на мой взгляд, оказался ассистент Ева: очень много говорит с роботами и с людьми, которые занимаются холодными рекламными звонками. Но были и люди, которые случайно ошиблись номером и заказывали у меня (у Евы) такси или подтверждали аренду какого-то места для хранения шин. Олег же показался менее разговорчивым и звонящий, как правило, сразу понимал, что это робот и разговор был достаточно коротким. Кира – мне показалось хуже, чем Ева, Олег, Маша или Салют. Кира пытается вести беседу со звонящим, но получается у нее это плохо. Алиса же сразу предлагает передать сообщение пользователю, что может быть и лучше, так как пользователь сразу понимает, что от него хотят.

Текстовая расшифровка аудио

Ева, Олег, Алиса, Маша, Кира высылают аудиозапись и расшифровку текста в телеграмм (если у вас тинькофф мобайл, то расшифровка от Олега будет в приложении тинькофф мобайл). Алиса дополнительно может отсылать в яндекс месседжер, viber. А вот Салют отсылает пока только в приложение сбербанка. Стоит дополнительно отметить, что у Киры в мобильной версии телеграмм номер телефона звонящего не отображается в виде ссылки, и приходиться вносить номер вручную или копировать его в адресную книгу для того что бы узнать имя звонящего вам абонента.

Сравнительная таблица

Спасибо тем, кто прочитал этот текст полностью. Если есть замечания по тексту — пишите личным сообщением или в комментарии.

Голосовые помощники: эволюция, устройство и основные игроки

DTI Algorithmic

Уточнить у Siri рецепт сырников во время готовки или попросить Алису прочитать сказку — вполне привычные для нашей жизни сценарии. А как это работает? Как звук превращается в понятные виртуальному помощнику команды, которые сразу же исполняются? Кто главные игроки на рынке? Какие еще заботы могут снять с нас голосовые помощники?

Редакция DTI Algorithmic собрала ответы на все эти вопросы — и помогали нам в этом наши программисты и союзники. В результате получился информационно насыщенный лонгрид, который мы будем публиковать по частям. Сегодня — про эволюцию голосовых помощников, их устройство и основных игроков на рынке.

Эволюция голосовых помощников

История голосовых ассистентов начинается с конца 1930-х годов, когда ученые начали предпринимать попытки распознать голос силами технологий. Тогда созданию качественного помощника мешали две большие проблемы:

  • существование омонимов — слов с одинаковым звучанием, но с разным значением,
  • постоянный шумовой фон, из которого система должна выбирать речь пользователя.

#справка Подробнее про историю и эволюцию технологии распознавания речи на Medium

Сейчас для решения этих проблем разработчики используют машинное обучение. Оно учит нейронные сети самостоятельно анализировать контекст и эффективно определять основной источник звука. Однако пришли разработчики к этому не сразу — потребовалось как минимум 80 лет подготовительных работ:

1939 год. Советский физик Лев Мясников создал аппарат, способный распознавать человеческую речь — несколько гласных и согласных звуков.

1952 год. Сотрудники лаборатории Bell разработали механизм, который распознавал продиктованные по телефону числа от 1 до 9.

1962 год. Компания IBM представила собственную технологию распознавания речи — Shoebox. Машина распознавала 16 английских слов, 10 цифр и 6 арифметических команд.

Презентация системы распознавания речи Shoebox от IBM

1980 год. Инженеры научились применять методы «Скрытой модели Маркова». Со временем это позволило голосовым системам лучше распознавать речь. Они обрабатывают слово, учитывая несколько предыдущих и предсказывая, что может с ними сочетаться.

#справка Скрытая модель Маркова описывает генерацию случайных событий в зависимости от текущего состояния объекта. Пример: человек может находиться в одном из четырех состояний и не в каждое их них может перейти сразу (схема ниже). Например, если человек лежит, то он не может моментально пойти куда-либо — нужно сесть, встать и только потом идти

1987 год. В США компания Worlds of Wonder начала продавать говорящую куклу Джулию, которая училась распознавать речь ребенка во время игры. В куклу был встроен процессор, который позволял ей реагировать и генерировать речь. Джули воспринимала восемь высказываний: «Джули», «да», «нет», «хорошо», «притворяйся», «голодна», «пой» и «молчи».

Реклама интерактивной игрушки — куклы «Джули»

1990-е годы. Появилась коммерческая программа Dragon Dictate, ориентированная на массовый рынок. Она распознавала речь и записывала надиктованный текст в файл.

1996 год. Появилось полноценное голосовое меню VAL от BellSouth. Система обрабатывала телефонные справочные запросы и помогала покупателям в поиске нужной информации об интересующих товарах.

Позже компания запустила Info by Voice — интерактивные голосовые «желтые страницы» с информацией о ближайших ресторанах, такси и некоторых магазинах. Система также могла рассказать о новостях и котировках акций, погоде, телепрограмме, гороскопе и спортивных событиях.

2001 год. Компания Microsoft добавила голосовой ввод текста в офисный пакет Office XP.

2002 год. Google запустил Voice Search — сервис для голосового поиска в интернете. Проект приостановили из-за неудобства использования — чтобы выполнить поиск, надо было позвонить на специальный номер. На Voice Search основан современный интерактивный помощник компании — Google Assistant.

2007 год. Центр исследования искусственного интеллекта SRI International начал разработку Siri. Siri стала первой голосовой помощницей — система умела не только искать информацию в интернете или работать как голосовое меню, но и вести с пользователем диалог.

2011–2014 годы. Google интегрировал функцию голосового поиска в браузер Chrome. Компания также запустила персонализированного ассистента Google Now с расширенными возможностями голосового поиска — сервис подбирал актуальную информацию с учетом местоположения пользователя, истории браузера и других поисковых запросов.

У Microsoft также появилась собственная виртуальная голосовая помощница — Cortana.

#интересное Ассистент Microsoft назван в честь персонажа из игровой серии шутеров Halo. Фразы для него записала актриса озвучки Джен Тейлор, озвучившая Кортану в игре

2014 год. Amazon представил первую в мире умную колонку Amazon Echo с голосовой ассистенткой Alexa.

#справка Alexa от Amazon была вдохновлена компьютерной голосовой и диалоговой системой на борту Starship Enterprise в научно-фантастических сериалах и фильмах вселенной «Star Trek»

2017 год. Alibaba представила умную колонку Tmall Genie с голосовым помощником AliGenie.

2018 год. Яндекс выпустил умную колонку Яндекс.Станция с голосовой помощницей Алисой.

2019 год. Банк «Тинькофф» запустил собственного голосового ассистента «Олега». Mail.Ru Group представила голосовую помощницу «Марусю».

Как устроены современные голосовые помощники

Голосовые помощники пассивно считывают все звуковые сигналы, и для активной работы им необходима активация при помощи кодовой фразы. Например, произнесите: «Окей, Google», потом можете задать свой вопрос или отдать команду без пауз.

Математик Ханна Фрай исследует, как работает программное обеспечение для распознавания голоса, используемое в в домашней технике.

В момент голосового запроса автоматическая система распознавания речи (ASR system) преобразовывает звуковой сигнал в текст. Это происходит в четыре этапа:

    Система убирает из звукового сигнала шумовой фон и помехи, возникающие при записи. Звуковые волны преобразуются в понятный компьютеру цифровой вид. Параметры получаемого кода в том числе определяют качество записи. В сигнале выделяются участки, содержащие речь. Система оценивает ее параметры — к какой части речи относится слово, в какой оно форме, насколько вероятна связь между двумя словами. Полученную информацию система включает в словарь — собирает разные варианты произношения одного и того же слова. Чтобы точнее распознавать новые запросы, ассистенты сравнивают слова в них с шаблонами.

Если после обработки запроса виртуальный помощник не понимает команду или не может найти ответ, он просит перефразировать вопрос. В некоторых случаях могут понадобиться дополнительные данные — например, при вызове такси ассистент может уточнить местоположение пассажира и пункт назначения.

Основные игроки на рынке

По данным Microsoft, самые популярные голосовые помощники в США — Google Assistant, Siri от Apple, Alexa от Amazon и Cortana от Microsoft. Русский язык из них понимают только первые два, однако на российском рынке также работает Алиса от Яндекса, а на китайском — AliGenie от Alibaba. Сравнили основные характеристики умных колонок с поддержкой этих пяти голосовых ассистентов:

Google Ассистент

С Google Ассистентом можно легко управлять телефоном и приложениями, используя голосовые команды
Установите приложение и давайте поручения Ассистенту. С его помощью вы можете настраивать напоминания и будильники, следить за своим расписанием, искать информацию в Интернете, управлять устройствами умного дома на расстоянии* и выполнять другие задачи.

*Требуются совместимые устройства.

Удобное управление телефоном и приложениями
Без труда открывайте любимые приложения, управляйте телефоном и его настройками: включайте режим "Не беспокоить", настраивайте Bluetooth и режим полета, включайте фонарик – и все это с помощью голосовых команд.

"открой YouTube";
"покажи мои фото с Гавайев";
"включи фонарик".

Будьте на связи: просите Ассистента позвонить и отправить SMS или электронное письмо
Ваши близкие и друзья всегда рядом. Звоните, отправляйте SMS и находите адреса контактов с помощью Ассистента.

Успевайте всё, где бы вы ни были
Устанавливайте напоминания и будильники, следите за своим расписанием и планируйте день прямо на ходу. Находите ответы на вопросы, прокладывайте маршруты и узнавайте о местах поблизости.

"напомни мне купить молоко в 7 вечера";
"поставь будильник на 7 утра";
"установи таймер на 5 минут";
"добавь в список покупок яйца";
"какая у меня первая встреча завтра?";
"АЗС поблизости";
"проложи маршрут домой".

Будьте на шаг впереди
Получайте актуальную информацию и напоминания, чтобы вовремя справляться с любыми задачами. Для повседневных дел можно создавать автоматические программы.

Управляйте умным домом удаленно
С помощью телефона вы можете управлять умным домом на расстоянии. Настраивайте температуру и освещение, включайте и отключайте умные приборы, даже когда вас нет дома*.

"отправь оповещение "Еду домой" на колонки в спальне".

Alexa, сделай мне. кофе: краткий ликбез по современным голосовым помощникам

Alexa, сделай мне. кофе: краткий ликбез по современным голосовым помощникам

Что такое голосовой ассистент сегодня, пожалуй, знает любой «продвинутый» пользователь смартфона. Если у вас более-менее новый Android — чаще всего достаточно просто сказать «Ok Google» (или нажать на микрофончик возле строки поиска). Пользователи iOS чаще всего знакомы с Siri, которую легко позвать долгим нажатием кнопки Home. Но тогда кто же такая Алекса и в чем ее отличие?

Немного истории

В ноябре 2014 года Amazon представил миру новый технологический гаджет — Amazon Echo. Гаджет представляет из себя высокий конус, в который встроена достаточно мощная и качественная Bluetooth колонка и микрофоны. Тогда это был первое устройство подобного типа, и почти никто не понимал зачем ее предназначение. Да и стоила она немало — почти 200 долларов. (У нас ее продает, например, Stylus, но цены не отличаются гуманностью — примечание редакции).

Amazon Echo: первая умная колонка, поддерживающая голосовой сервис Alexa

Правда, для особо лояльных клиентов Amazon — участников программы Prime небольшое время она была доступна за 100 баксов. Через год после ее выхода, Amazon расширил линейку умных ассистентов, добавив к ней еще 2 устройства:

Amazon Dot: по сути тот же Echo, но предназначенный для использования с внешним динамиком, подключенным как по Bluetooth, так и по аудиопроводу. Хотя маломощная колонка присутствует и в самом устройство. Изначальная цена устройства была около ста долларов, но уже через полгода вышло второе поколение устройства за 50 долларов.

Amazon Dot

Amazon Dot: урезанная версия Echo, предназначенная для подключения к внешней колонке

Amazon Tap: Тоже урезанная колонка Amazon Echo, в которой оставили качественную колонку, но убрали, как по мне, самую главную «фишку» устройства — микрофоны, которые постоянно готовы слушать ваши приказания. В этой колонке для «вызова» ассистента нужно нажать на кнопку.

Amazon Dot

Amazon Tap: упрощенная версия Echo, для вызова помощника требуется нажать на кнопку

Кроме своих устройств, Amazon предоставило возможность другим производителям возможность «встраивать» своего голосового ассистента в их устройства — например в радио Invoxia Triby или даже в холодильнике LG Smart Instaview Fridge.

Ну и в конце 2016 на этот рынок вышел Google со своей умной колонкой Google Home стоимостью $129 долларов.

Google Home: аналог Amazon Echo для работы с ассистентом Google

Конкурент Amazon Echo компании Google

Зачем это мне и что может голосовой ассистент?

Внимание: Оба сервиса официально не доступны в Украине, потому надо понимать что ни один из них пока не говорит ни по-русски, ни, тем более, по-украински. Оба сервиса заточены по умолчанию на рынок США (Амазон еще и на UK) потому большинство служб, для который нужно ваша геопозиция будут недоступны. Также многие дополнительные сервисы официально доступны только в США….

Главная «особенность» этих устройств — по умолчанию они всегда вас слушают (не то что некоторые ваши родственники!) . У каждого из них есть свое «волшебное слово»: Alexa, Echo или Amazon на выбор для устройств от Amazon или «Ok,Google» для Google Home, услышав которое они готовы исполнять ваши приказания. Давайте рассмотрим, что они могут «из коробки» (расположено в плане полезности для «нашего человека»:

  • Воспроизведение музыки из онлайновых потоковых сервисов. Так, Amazon Alexa может играть музыку с Amazon Music, Amazon Music Unlimited и Spotify. Google Home — из Google Music и Spotify. Оба также могут воспроизводить радиостанции из TuneIn. Amazon также предлагает вам доступ к сервису Audible, на котором доступно (за дополнительную плату) много аудиокниг, на английском конечно. Для меня сейчас это основное применение ассистента — даже мой трехлетний сын выучил ключевую фразу «Alexa play Peppa Pig Song». Жена часто слушает американские топ-чарты, а я предпочитаю олдскульную классику рока. У нас подключен аккаунт Spotify в котором есть практически любая музыка, разве что русские названия групп произнести удается не всегда — иногда приходиться запускать с телефона через приложение ( Aleksa, play OKEAN ELZY — понимает раз из пяти).
  • Доступ к вашему календарю Google — обе колонки могут читать события из вашего календаря (если, конечно они написаны по-английски) . Что интересно, добавлять события пока умеет только Amazon Alexa.
  • Простой доступ к википедии и поиску. Оба сервиса могут ответить вам на простые вопросы как то «Что такое гравицапа» или «Сколько будет 2+2». При этом Alexa использует для поиска Bing, в отличии от Google Home.
  • Часы («Алекса, а который час сейчас в Нью Йорке?»), таймер, прогноз погоды.
  • Каждое из устройств имеет немалый список (Алекса больший, Гугл меньший) устройств «умного дома», с которым она может быть соединена. Благодаря этому вы легко можете включить/выключить свет в доме (если у вас стоят умные лампы от Phillips с милозвучным названием Hue) , включить ТВ (если у вас умный пульт Logitech Harmony) и даже сварить кофе ( при помощи подключаемой кофеварки Behmor).
  • У каждого устройства есть свой канал IFTTT который позволяет искушенному пользователю настраивать голосовые команды под себя.
  • Для устройств от Amazon доступно уже более 300 «внешних» дополнений (они их называют Skills или умения) от сторонних производителей, при помощи которых колонка станет еще «умнее». Например, вы можете спросить совета у раввина, вызвать Uber или поиграть в разные голосовые игры. Также вы можете попросить Алексу найти для вас в интернете нужный рецепт блюда. Google Home обещала представить подобное в начале 2017, пока ждем.
  • Google Home имеет еще одну фишку — она может «взаимодействовать» с другими устройствами Google — Chromecast (как аудио так и видео) . Благодаря этому, вы можете попросить Google Home показать вам на телевизоре нужный видеоролик (вам надо точно знать как он называется) или фильм с Netflix.

Так я не понял, мне оно надо?

Признаюсь, пока в Украине такие ассистенты — в большинстве случаев просто умная колонка, которая может воспроизводить музыку, которую у нее попросите. Но даже для этой цели вам надо будет «постараться» — пользоваться тем же Spotify в Украине не просто. (У нас есть отдельная статья как подключить Spotify в наших условиях — примечание редакции). Либо же поможет тем, у кого немало устройств умного дома последнего поколения, добавив к ним возможность голосового управления. Но, как только кто то из них добавит поддержку русского языка и сервисов, актуальных для Украины, возможностей для применения станет в разы больше. Голосовой интерфейс в интернет — это действительно удобно, но пока под него надо слишком сильно «подстраиваться».

Личный опыт

Как настоящий «трушный гик» я не долго устоял перед соблазном заказа себе голосового ассистента. 200 баксов мне было на него жаль, но когда он стал стоить сто, я не устоял. Так в моем доме поселился Amazon Dot (первого поколения). И живет там уже почти год. Для полноценного его использования пришлось сделать несколько финтов ушами, а именно:

  • Оплатить на год доступ к специальному proxy серверу tunlr.com ( 10 долларов в год). Он очень легко настраивает туннель с вашего роутера на американские ресурсы, выдавая вас за добропорядочного американца.
  • Купить премиум семейный доступ к крутейшему музыкальному сервису Spotify на котором есть вся интересующая меня музыка и который поддерживает Amazon Echo (в отличии от Google Music). Покупал за $30 на ebay, теоретически «филиппинскую семью» можно найти и дешевле.

Использую Amazon Dot в основном для воспроизведения музыки, заказывать ее научились у меня дома как взрослые, так и дети. Пытался слушать аудиокниги, но все же пока трудно воспринимать на английском.

. Продолжаю облизываться на Google Home, но пока жду, когда он заговорит по-русски.

Для тех, кто хочет знать больше

Подписывайтесь на наш нескучный канал в Telegram, чтобы ничего не пропустить.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *