В том, что Siri не отличается умом и сообразительностью мы поняли уже давно. Казалось бы, голосовой помощник от компании Apple умеет разговаривать на русском уже больше 6 лет. Можно было уже давно избавиться от всяких багов и научиться отвечать на банальные вопросы, но нет, купертиновцы до сих пор не могут заставить эту функцию работать так, как подобает настоящим голосовым помощникам. Можно, конечно, сослаться на сложность внедрения технологий и прочие тонкости, но стоит хоть раз поговорить с Алисой, как сразу становится понятно — в Apple работают настоящие лодыри. В статье предлагаю подробно поговорить о самом плохом голосовом помощнике от самой лучше компании.
Рассказываем о нюансах работы Siri, которые должен знать каждый.
Несмотря на все ошибки Siri, найти ему должное применение все же можно. В своих прошлых статьях я уже рассказывал о том, какое применение нашел для фирменного голосового помощника. Если еще не знакомы с материалом, обязательно прочтите.
Не отвечает Siri на iPhone: что делать
Что такое голосовой помощник
Голосовой помощник – это программа, работающая на основе Искусственного Интеллекта, которая может распознавать человеческую речь, давать ответы голосом и выполнять определенные команды.
Представьте, с вами рядом всегда находится ваш преданный друг, который в любое время дня и ночи готов с вами поговорить, ответить на любой ваш вопрос и выполнить поручения. При этом он никогда не устает, у него не бывает плохого настроения, и он с каждым днем становится всё умнее и понимает вас всё лучше. Это и есть голосовые помощники, которые доступны для повседневного использования уже сегодня.
Голосовые помощники и умные колонки, в которых они «живут»
Голосовые помощники встроены в компьютеры, планшеты, телефоны, умные часы, умные колонки и даже в автомобили. Важно понимать, что взаимодействие с голосовым помощником осуществляется исключительно голосом, без использования рук, не нажимая ни на какие кнопки. Это принципиально новый способ взаимодействия человека и программы, который очень похож на общение между людьми.
Давать команды голосом особенно удобно, когда ваши руки заняты: в процессе приготовления еды, во время пробежки, за рулем автомобиля, или когда просто не хочется вставать с кровати, чтобы выключить свет.
Кроме этого, голосовые ассистенты значительно повышают качество жизни людей с ограниченными возможностями, помогая им взаимодействовать с окружающим миром.
Среди всех существующих голосовых помощников можно выделить:
- Siri от Apple
- Google Ассистент от Google
- Alexa от Amazon
- Bixby от Samsung
- Алиса от Яндекс
- Маруся от VK (Mail.ru Group)
- Салют от Сбер
Мы уже писали ранее про Алису и Google Ассистент, а в этой статье мы подробно расскажем о Сири.
Работа с величинами и математика
С Сири удобно конвертировать любые величины. Попросите свою помощницу сделать это. Она работает с основными параметрами: объем, вес, длина, площадь, временные показатели, валюта.
Виртуальный ассистент не справиться со сложными математическими задачками, но просто арифметический счет осилит. В данном случае е можно назвать удобным калькулятором, решающим одномоментно несколько действий. Простые примеры:
- сколько будет 30 разделить на 3;
- 40 процентов от 340;
- 455 плюс 678 умножить на 4.
Голосовой помощник Siri
Siri – это голосовой помощник, который первым стал поддерживать русский язык, и только потом появилась отечественная Алиса от Яндекса, вышедшая в конце 2022 года, а еще позже летом 2022 на русском заговорил Google Assistant. Сири довольно хорошо распознает русскую речь, даже если рядом играет музыка или присутствуют посторонние шумы.
Сири в iPhone SE
Siri не всегда принадлежала компании Apple. Изначально, это было отдельное приложение в App Store для iOS. В 2010 году Apple приобрела компанию Siri Inc. и их уникальную разработку. Вскоре после покупки, Apple встроила Сири в iPhone 4S, а затем и в последующие свои устройства. Тогда, в 2011 году, Siri стала первым продуктом на рынке персональных голосовых ассистентов.
Siri подстраивается под каждого пользователя индивидуально, изучает его предпочтения и начинает лучше понимать своего «хозяина». В первую очередь это заметно в улучшении распознавания вашего голоса после первых недель использования. Также есть возможность указать Siri, как следует обращаться к вам и называть имена ваших контактов из адресной книги, чтобы она лучше вас понимала. А когда Siri произносит имена неправильно, всегда можно её поправить, показать правильное ударение.
Siri доступна на iPhone, iPad, Mac, Apple Watch, Apple TV и HomePod, а также почти во всех современных автомобилях через функцию CarPlay. Способ запуска Siri и список доступных команд разнится в зависимости от устройства.
Используемые технологии
Для того чтобы лучше понимать, что умеет Сири, представляем вам список партнерских технологий, которые интегрированы в агент:
Информация о фильмах, книгах, рецензии – The NYT, Rotton Tomatoes, Movietickets.
- Погода – Yahoo Weather.
- Реестры и деловая активность – Inc, Yandex, Localize, Yahoo local.
- Веб-поиск – Google, Bing, Yahoo.
- Также есть функционал CityShearch,Yelp, AndreGayot, OpenTable, BooRah.
Все функциональные возможности тесно связаны и взаимодействуют между собой.
Как запустить Siri на iPhone, iPad и iPod touch
Запуск нажатием кнопки «Домой»
Siri доступна на всех iPhone, начиная с iPhone 4s, на операционной системе iOS 5 и выше. Для запуска Siri на iPhone (за исключением iPhone X), нужно нажать и удерживать .
Чтобы запустить Сири на iPhone X необходимо нажать и удерживать боковую кнопку.
После звукового сигнала, можно произносить запрос. На некоторых устройствах следует дождаться появления Siri на экране, прежде чем давать команду.
Интернет-ресурсы и возможности программы
Команды для Сири на русском языке может задавать любой пользователь, упрощая процесс отправки электронной почты, совершать видеозвонки, искать информацию в Сети. Ассистент найдёт нужную книгу, документ, аудифайл или видео. Даже делать посты в социальных сетях проще и удобнее.
Запрос относительно поиска конкретной информации можно конкретизировать по максимуму. Примеры:
- найди в интернете (общая фраза);
- найди в Википедии;
- найди в Гугл;
- найди новости.
Отдельно стоит упомянуть о взаимодействии с сервисом iTunes. Сири угадывает музыку и может найти ее в Сети. Других файлов это тоже касается.
Привет, Сири – Как включить Siri голосом
Siri можно запускать исключительно с помощью голоса, вообще без нажатия на кнопки. Нужно будет всего лишь сказать: «Привет, Siri». После звукового сигнала можно задавать вопрос или давать команду.
Для этого на устройстве должна быть активирована функция «Привет, Siri»: Настройки → Siri и поиск → Слушать «Привет, Siri».
На всех моделях iPhone, начиная с iPhone 6s, а также на iPad Pro эту функцию можно использовать в любой момент, сказав «Привет, Siri» так, чтобы это уловили микрофоны гаджета. На более ранних айфонах и айпадах функция «всегда слушает» работает только тогда, когда ваш гаджет подключен к зарядному устройству.
Олег от «Тинькофф»
В банке «Тинькофф» появился персональный электронный помощник «Олег». Он интегрирован в мобильные приложения банка после обновления 4.8 для iOS. Основатель компании О. Тиньков провел презентацию ассистента в декабре 2022 года.
Искусственный интеллект управляет финансами клиентов банка, помогает планировать и распоряжаться ими. «Олег» – вежливый и компетентный молодой «мужчина».
Он помогает:
- переводить деньги;
- ищет скидки;
- бронирует столики в кафе, билеты в театры, записывает в бассейны, парикмахерские;
- управляет банковскими картами;
- работает с электронной почтой;
- консультирует по финансовым вопросам;
- разговаривает, развлекает клиента.
Лайки и дизлайки за выполненную работу помогают приложению лучше понимать приоритеты пользователя.
Когда «Олег» не может ответить, он вызывает менеджера банка. Сам в это время собирает нужную информацию, передает сотруднику.
«Олег» вырабатывает навыки к стилистике речи пользователя, подстраивается под тип беседы. Вскоре они говорят «на равных».
Скачивают и запускают приложение с официального сайта банка. Запрос начинают со слов «Привет, Олег!», либо «Слушай, Олег!».
В кол-центрах Сбербанка, ВТБ, Альфа-Банка также успешно используют виртуальных помощников. Они на 25% заменяют реальных сотрудников.
Как включить Сири в наушниках
Используя оригинальную гарнитуру Apple с кнопками дистанционного управления или совместимые Bluetooth-наушники, активировать Siri можно нажатием на центральную кнопку или кнопку вызова. После звукового сигнала можно делать запрос.
Используя беспроводную гарнитуру AirPods от Apple, для запуска Siri дважды прикоснитесь к внешней поверхности любого наушника.
Инструкция по использованию
Чтобы упростить свои рабочие процессы, инсталлируют приложение «Алиса» – загружают бот с сайта разработчика.
Алгоритм для ПК:
- открывают страницу разработчика;
- нажимают «Скачать»;
- ждут загрузки на ПК;
- кликают «Установить»;
- следуют указаниям системы.
Алгоритм для телефонов:
- нажимают на ссылку официальной страницы приложения;
- выбирают собственную систему на мобильном;
- открывают магазин приложений;
- набирают запрос;
- выбирают программу, жмут «Установить».
Владельцы айфонов не могут установить приложение. Но можно загрузить на смартфон от через «Плей Маркет». Голосовой помощник «Алиса» устанавливают бесплатно.
Сири на компьютере Mac
Siri доступна на компьютерах Mac с macOS 10.12 Sierra и более новыми версиями операционной системы. Однако, на данный момент функционал голосового помощника на маке ограничен. Все, что здесь умеет Siri – звонить по FaceTime, писать сообщения, включать музыку, показывать прогноз погоды и помогать работать с файлами и папками.
Сири на маке
Стоит отметить, что работа с файлами на компьютере с помощью голосового ассистента действительно удобна. Сири может осуществлять быстрый поиск файлов, сортировать их по типу, дате или ключевому слову. Например, если сказать Сири: «Покажи мои фотографии за вчерашний день», то откроется папка с соответствующими медиафайлами.
Активировать Siri на Mac можно несколькими способами:
- Нажать иконку Siri в панели меню (правый верхний угол).
- Нажать и удерживать одновременно клавишу Command (⌘) и клавишу «Пробел» (при условии, что эта комбинаций клавиш не была переназначена).
Запуск с помощью голосовой команды «Привет, Siri» на компьютерах пока не работает. Имеется обходной способ настроить такой вид активации через функцию «Диктовки», но мы его не рекомендуем.
Вероятно, в следующих версиях macOS появится больше команд для Siri, включая команды для HomeKit. Это будет логичным продолжением интеграции голосового помощника от Apple в свои ноутбуки и настольные компьютеры.
Самые популярные запросы
Возможности Сири в плане управления функциями и режимами устройства практически не ограничены. Вот примеры:
- увеличить громкость проигрывателя;
- уменьшить яркость экрана;
- включить режим энергосбережения;
- открыть настройки с уведомлениями;
- включить вай-фай;
- включить блютуз;
- включить режим «без звука»;
- открыть настройки уведомлений.
Базовые умения Сири – работать с вызовами и сообщениями. Программу можно «научить» различать даже родственные связи. Вот команды, которые чаще всего используются:
- набери маму;
- набери номер (пользователь диктует комбинацию чисел);
- набери сообщение Саше;
- покажи сообщения от Лены.
Быстрый старт
- Скачайте проект с Github
- Для быстрой установки всех требуемых зависимостей можно воспользоваться командой: pip install -r requirements.txt
- Для запуска запустите файл runva_vosk.py из корневой папки. По умолчанию он запустит оффлайн-распознаватель vosk для распознавания речи с микрофона, и pyttsx движок для озвучивания ассистента (стандартный движок Windows для синтеза речи).
- После запуска проверить можно простой командой — скажите «Ирина, привет!» в микрофон
Свои Text-to-Speech и Speech-to-Text движки
По умолчанию для распознания речи используется движок VOSK, для синтеза — Windows (голос Irene).
Дописать свои варианты вполне можно, это стандартная операция. Детали — в Github.
Уже доступен STT через модуль SpeechReсognition (онлайн-распознавание от Гугла и пр.), а также TTS через Silero (нейросетевая генерация оффлайн). Мне не очень понравился результат Silero (хотя сам проект прекрасен) — генерируется дольше, задержка в несколько секунд, а также есть «металлические» шумы, но, возможно, он подойдет вам. (Кстати, в одном из комментариев @putnik поделился собственным анализом доступных движков TTS и STT.)
Кстати, имя помощника тоже настраивается в файле конфигурации — так что если нужно, можете сделать, чтобы он откликался на имя «Джарвис». И можно поставить мужской голос, конечно.
Свои плагины
Честно говоря, у меня уже есть несколько собственных плагинов чисто «под себя».
Например, по «ирина, запусти музыку» открывается Яндекс.Музыка.
Еще у нас есть локальный, не сетевой доставщик неплохой пиццы (PushPizza, если кому интересно). Где-то за полчаса я написал плагин, который проверяет, в каком состоянии доставка — готовится, или едет. Написан алгоритм с использованием библиотеки pyautogui, позволяющей эмулировать ввод пользователя (мышь и клавиатуру):
- Открыть страницу доставки
- Подождать чуть-чуть
- Найти на экране картинку (форму ввода телефона) (да, в pyautogui такое есть из коробки)
- Перевести туда мышь и кликнуть
- Сэмулировать ввод телефона
- Вуаля! Страница со статусом доставки доступна
В общем, вроде писать плагины оказалось несложно. (Если вы вдруг что-то напишете и захотите поделиться, можете кидать ссылки сюда.
Готовые плагины
С Ириной поставляются плагины, которые закрывают большую часть обыденных кейсов использования голосового помощника (если вы, конечно, не собираетесь с ним общаться). Для каждого плагина написано, требуется ли онлайн. Для отключения удалите его из папки.
plugin_greetings.py — приветствие (оффлайн). Пример команды: «ирина, привет»
plugin_timer.py — таймер (оффлайн). Примеры: «таймер, таймер шесть минут, таймер десять секунд, таймер десять» (без указания единиц ставит на минуты — «таймер десять» — на десять минут. Просто «таймер» ставит на пять минут)
plugin_mediacmds.py — команды управления медиа (оффлайн). Пример: «дальше, громче, тише, сильно громче, сильно тише, пауза». (Если установлено mpcIsUseHttpRemote, то сначала делается попытка вызвать команду плеера MPC-HC, если не удается — используется эмуляция мультимедийных клавиш)
plugin_mpchcmult.py — проигрывание мультиков через MPC-HC из определенной папки (оффлайн). Пример «мультик <�название_мультика>». Папка задается в конфиге. При вызове команды в папке ищется файл с соответствующим названием <�название_мультика> и любым расширением. Если найден — запускается на проигрывание. (Как можно догадаться, этот плагин предназначен для показа отобранных медиа без обращения к ютубу.)
plugin_random.py — рандом (оффлайн). Примеры: «подбрось|брось кубик|монетку». Содержит примеры парсинга дерева команд (команды можно задавать деревом). Больше демонстрационный плагин.
plugin_weatherowm.py — погода (онлайн). Примеры: «погода, погода завтра, погода послезавтра, прогноз погоды». Требует установки в конфиге бесплатного API-ключа отсюда, а также местоположения пользователя.
plugin_yandex_rasp.py — расписание ближайших электричек через Яндекс.Расписания. Пример: «электричка, электрички». Требует установки в конфиге бесплатного API-ключа для личных нужд (до 500 запросов в сутки) отсюда, а также станций отправления и назначения. (Если вы ездите на электричке — фраза «ирина, электричка» очень удобна для проверки расписания)
plugin_tts_pyttsx.py — (оффлайн) позволяет делать TTS (Text-To-Speech, озвучку текста) через pyttsx движок. Используется по умолчанию.
plugin_tts_console.py — (оффлайн) заглушка для отладки. Вместо работы TTS просто выводит текст в консоль.