18.11 - 09:45

Умные устройства научились понимать направление речи


 

Американские инженеры разработали алгоритм, позволяющий умным устройствам понимать направление речи человека. Это позволяет не использовать фразы активации, такие как «Окей, Google» или «Привет, Siri», поскольку устройство будет понимать, что пользователь обращается к нему. Статья была представлена на конференции UIST 2020.

Голосовые помощники в умных колонках, смартфонах или ТВ-приставках, как правило, все время слушают пользователя в ожидании активационной фразы и начинают слушать сами команды только после ее произнесения. Но между собой люди общаются проще и используют невербальные признаки, такие как направление взгляда, чтобы понять, что другой человек обращается к ним. Использование таких признаков голосовыми помощниками могло бы упростить их использование в доме, где есть несколько устройств с такой функцией, и некоторые разработчики уже работают над этим. Например, Apple недавно предложила оснащать умные колонки камерами с алгоритмами отслеживания взгляда, чтобы избавить их от активационной фразы и научить понимать, на какие предметы показывает человек. Но камеры потенциально могут раскрыть больше конфиденциальной информации, чем микрофоны, поэтому пока умные колонки в основном работают без них.

Инженеры из Университета Карнеги — Меллона под руководством Криса Харрисона (Chris Harrison) разработали новый метод, который позволяет определять направление речи человека с помощью микрофонов, а не камер.

 

Принцип работы алгоритма основан на двух особенностях распространения звука при речи. Главная из них заключается в том, что звуки разных частот по-разному распределяются вокруг рта: высокочастотная часть сконцентрирована перед ртом, а по мере удаления от центрального направления интенсивность сильно снижается, тогда как низкочастотные звуки распределены более равномерно. Таким образом, в записанном микрофоном звуке соотношение низких и высоких частот различается в зависимости от направления источника звука. Авторы использовали это для расчета этого направления. Алгоритм отдельно рассчитывает мощность колебаний с частотой до семи килогерц и выше семи килогерц, затем проводит быстрое преобразование Фурье и по соотношению мощностей двух диапазонов определяет угол к микрофону, под которым была произнесена речь.

Вторая особенность, которую использовали разработчики, заключается в том, что при разговоре в помещении возникает небольшое эхо. Соответственно, если человек повернут к микрофону, первый достигший микрофона сигнал будет четким, а за ним могут появиться намного меньшие по интенсивности и четкости повторения. Если же человек отвернут, то все колебания будут дублироваться и искажаться. Алгоритм, созданный разработчиками анализирует форму сигнала в первые 10 миллисекунд после начала речи. Он вычисляет величину наибольшего пика интенсивности звука, сравнивает ее со средним от остальных пиков за этот временной промежуток и определяет, был ли человек отвернут от микрофона.

Инженеры обучили алгоритм, сделав множество записей под разным углом и с разного расстояния, а затем обучив классификатор, работающий на одном из вариантов дерева решений. В результате им удалось достичь точности определения того, обращен ли человек лицом к микрофону, равной 90 процентам. Если алгоритм обучен на конкретном помещении, точность повышается до 93 процентов. Авторы отмечают, что это ниже, чем точность, которую пользователи ожидают от функций серийных голосовых помощников, но выше, чем у разработанных ранее методов.



Недавно ведущий автор новой работы Крис Харрисон вместе с коллегами по университету и инженерами из Apple разработал алгоритм, позволяющий умной колонке самостоятельно учиться распознавать звуки бытовых действий в доме, к примеру, включения микроволновой печи. Он в пассивном режиме распознает одни и те же звуки с помощью кластерного анализа, а когда данных становится достаточно, спрашивает у человека, что это за звук, чтобы затем уметь выполнять действия, связанные с этим действием.
Григорий Копиев

https://nplus1.ru/

Ключевые слова:
Читайте также:

Named the most useful cereal for health

Researchers continue to study the usefulness of various products for human health, and one of the results of these studies is the identification of the most useful cereals
Подробнее »»

Названа наиболее полезная крупа для здоровья

Исследователи продолжают изучать полезность различных продуктов для здоровья человека, и одним из результатов этих исследований является выявление самой полезной крупы
Подробнее »»

Названо найбільш корисну крупу для здоров'я

Дослідники продовжують вивчати корисність різних продуктів для здоров'я людини, і одним з результатів цих досліджень є виявлення найкориснішої крупи.
Подробнее »»

6 najbardziej szkodliwych pokarmów dla wątroby: zwiększ swoją świadomość zdrowotną

Wątroba to niezwykle ważny narząd odpowiedzialny za oczyszczanie organizmu z toksyn oraz wytwarzanie żółci niezbędnej do prawidłowego trawienia.
Подробнее »»

Die 6 schädlichsten Lebensmittel für die Leber: Steigern Sie Ihr Gesundheitsbewusstsein

Die Leber ist ein äußerst wichtiges Organ, das dafür verantwortlich ist, den Körper von Giftstoffen zu reinigen und Galle zu produzieren, die für eine ordnungsgemäße Verdauung notwendig ist.
Подробнее »»

bigmir)net TOP 100 Яндекс.Метрика

При использовании информации в печатном или электронном виде ссылка на www.neboley.com.ua обязательна.
Интернет–издание не несет ответственность за достоверность информации, размещенной в разделах народной медицины. Предупреждаем, прежде чем воспользоваться рецептами нетрадиционной медицины обязательно посоветуйтесь с врачом.
За содержание рекламы ответственность несет рекламодатель.

Электронная почта портала: info@neboley.com.ua