Перейти к основному контенту
Технологии и медиа⁠,
0

«Яндекс» раскрыл технологию распознавания голосовых команд в шумной среде

Яндекс YDEX ₽4 159 +0,11% Купить
Фото: Андрей Гордеев / Ведомости / ТАСС
Фото: Андрей Гордеев / Ведомости / ТАСС

«Яндекс» представил нейросетевую технологию, позволяющую распознавать голосовые команды даже в условиях сильного фонового шума, сообщили в компании. Решение уже используется в «умных» колонках и ТВ-станциях компании с голосовым помощником «Алиса».

«До сих пор не существовало единого подхода к распознаванию голоса в шумной среде, который был бы одинаково надежен в лабораторных тестах и в реальных условиях», — заявил руководитель направления голосовой активации «Яндекса» Дмитрий Солодуха.

Ключевым элементом технологии является специально разработанный attention-механизм, который одновременно анализирует два звуковых сигнала — один после прохождения через алгоритм эхоподавления, второй — через алгоритм шумоподавления. В каждый момент времени нейросеть выбирает из них тот, где речь распознана наиболее четко. Такой подход позволяет избежать искажений, характерных для традиционного шумоподавления, и обеспечивает устойчивую работу даже в шумной обстановке — например, при включенной музыке, работающем пылесосе или уличных звуках.

«Обычно в «умных» устройствах и ассистентах используют алгоритмы эхоподавления, которые помогают распознать голос на фоне музыки. Уменьшить другие фоновые звуки помогают алгоритмы шумоподавления, но они ухудшают и человеческую речь», — отметили в «Яндексе». Компания также анонсировала научную статью с описанием технологии. Ее авторы выразили надежду, что публикация, в частности, может ускорить прогресс в области голосовых интерфейсов.

«Яндекс» отменил плату за большинство функций нейросети «Алиса»
Технологии и медиа
Фото:Владислав Шатило / РБК

Неделей ранее, 22 июля, в «Яндексе» анонсировали запуск агента на базе искусственного интеллекта для аналитики и визуализации данных — «Нейроаналитика». Новый инструмент позволит находить инсайты, делать выводы на основе таблиц и графиков, а также создавать и редактировать визуализации с помощью запросов на естественном языке.

Агент будет встроен в BI-сервис Yandex DataLens в виде чата и сможет перестраивать графики или менять формулы по пользовательским запросам. В компании ожидают, что инструмент снизит нагрузку на аналитиков и ускорит проверку гипотез и подготовку отчетов примерно на 30%. Первая версия продукта выйдет в сентябре, уже открыт лист ожидания.

Читайте РБК в Telegram.

Авторы
Теги
Магазин исследований Аналитика по теме "Интернет"
Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.
Лента новостей
Курс евро на 14 января
EUR ЦБ: 92,4 (+0,43)
Инвестиции, 13 янв, 18:09
Курс доллара на 14 января
USD ЦБ: 78,85 (+0,06)
Инвестиции, 13 янв, 18:09
Индекс Мосбиржи вырос на новостях о визите Уиткоффа и Кушнера в Москву Инвестиции, 11:56
Российские шорт-трекисты приняли приглашение МОК выступить на Олимпиаде Спорт, 11:56
Bloomberg анонсировал новый визит Уиткоффа и Кушнера в Москву Политика, 11:39
Великобритания не выдала визы армянским фигуристам на чемпионат Европы Спорт, 11:39
Как просить повышения зарплаты: пошаговое руководство и советы экспертов Образование, 11:37
Акции ГК «Астра» выросли на 4% на новости о планах купить «МойОфис» Инвестиции, 11:32
Прибыль в отчете есть, денег в кассе нет. Как найти «слепые зоны» бизнесаПодписка на РБК, 11:30
Определите свой тип лидерства
Это займет всего 5 минут
Пройти тест
Играем в бизнес с не всегда ясными правилами. Тест РБК и Яндекс Реклама, 11:27
Гришковец рассказал, как Золотовицкий играл на сцене, несмотря на болезнь Общество, 11:26
Тимошенко заявила о фактическом захвате офиса «Батькивщины» при обысках Политика, 11:25
Объем продаж просекко в 2025 году превысил 667 млн бутылок Вино, 11:15
Украинская гимнастка раскритиковала выступающую за Германию россиянку Спорт, 11:13
Стало известно время смерти Игоря Золотовицкого Общество, 11:12
Власти Коста-Рики заявили о предотвращении покушения на президента Чавеса Политика, 11:10