Apple рассказала о функции «Привет, Siri» в блоге о машинном обучении

В июле Apple открыла новый блог о машинном обучении и других областях, в котором специалисты могут рассказывать о своей работе.

siri-logo

Сегодня в нём была опубликована новая запись о функции «Привет, Siri», которая служит для активации виртуального помощника. Запись опубликована командой Siri, и в ней подробно описано, как работает данная функция.

В сопроцессор движения встроен распознаватель речи, который активен постоянно, т.е. устройство всегда слушает вас в ожидании слов «Привет, Siri». Когда устройство слышит эти слова, оно воспринимает последующую речь уже как запрос.

«Микрофон в iPhone или Apple Watch превращает ваш голос в звуковые волны с частотой 16000 в секунду. Этап анализа спектра преобразует поток волн в последовательность кадров, каждый из которых описывает звуковой спектр длиной в 0.01 секунды. Примерно двадцать кадров за раз (0.2 секунды) превращаются в акустическую модель, и каждая из них сортируется по множеству звуковых типов речи, из которых состоит сама фраза «Привет, Siri», тишина и другая речь. Всего их примерно двадцать».

Нейронная сеть используется для того, чтобы распознавать речь пользователя, затем анализировать её и понимать, была ли произнесена фраза «Привет, Siri». После того, как устройство слышит эти слова, подключается Siri и выполняет запрос.

Всю запись можно прочитать здесь. Если вам интересно, как работает Siri, то это точно стоит сделать.

Оцените пост
[всего: 0 рейтинг: 0]

Комментарии

Добавить комментарий