Перейти к основному контенту
Технологии и медиа⁠,
0

«Яндекс» раскрыл технологию распознавания голосовых команд в шумной среде

Яндекс YDEX ₽4 159 +0,11% Купить
Фото: Андрей Гордеев / Ведомости / ТАСС
Фото: Андрей Гордеев / Ведомости / ТАСС

«Яндекс» представил нейросетевую технологию, позволяющую распознавать голосовые команды даже в условиях сильного фонового шума, сообщили в компании. Решение уже используется в «умных» колонках и ТВ-станциях компании с голосовым помощником «Алиса».

«До сих пор не существовало единого подхода к распознаванию голоса в шумной среде, который был бы одинаково надежен в лабораторных тестах и в реальных условиях», — заявил руководитель направления голосовой активации «Яндекса» Дмитрий Солодуха.

Ключевым элементом технологии является специально разработанный attention-механизм, который одновременно анализирует два звуковых сигнала — один после прохождения через алгоритм эхоподавления, второй — через алгоритм шумоподавления. В каждый момент времени нейросеть выбирает из них тот, где речь распознана наиболее четко. Такой подход позволяет избежать искажений, характерных для традиционного шумоподавления, и обеспечивает устойчивую работу даже в шумной обстановке — например, при включенной музыке, работающем пылесосе или уличных звуках.

«Обычно в «умных» устройствах и ассистентах используют алгоритмы эхоподавления, которые помогают распознать голос на фоне музыки. Уменьшить другие фоновые звуки помогают алгоритмы шумоподавления, но они ухудшают и человеческую речь», — отметили в «Яндексе». Компания также анонсировала научную статью с описанием технологии. Ее авторы выразили надежду, что публикация, в частности, может ускорить прогресс в области голосовых интерфейсов.

«Яндекс» отменил плату за большинство функций нейросети «Алиса»
Технологии и медиа
Фото:Владислав Шатило / РБК

Неделей ранее, 22 июля, в «Яндексе» анонсировали запуск агента на базе искусственного интеллекта для аналитики и визуализации данных — «Нейроаналитика». Новый инструмент позволит находить инсайты, делать выводы на основе таблиц и графиков, а также создавать и редактировать визуализации с помощью запросов на естественном языке.

Агент будет встроен в BI-сервис Yandex DataLens в виде чата и сможет перестраивать графики или менять формулы по пользовательским запросам. В компании ожидают, что инструмент снизит нагрузку на аналитиков и ускорит проверку гипотез и подготовку отчетов примерно на 30%. Первая версия продукта выйдет в сентябре, уже открыт лист ожидания.

Читайте РБК в Telegram.

Чем поможет ИИ от Сбера?

Попробуйте новую функцию «ГигаЧат» — общаться голосом

Какое вино подать к ужину, если не знаешь предпочтения гостей

Как приготовить говядину в вине по-бургундски                         

Чем занять детей, пока взрослые общаются за столом

Как легко завести разговор в компании, где все только что познакомились

О чём надо позаботиться, если собираешься позвать много гостей

Из каких сыров и ветчин собрать тарелку закусок к вину

Что делать, если пролил красное вино на белую скатерть

Какие есть правила классической сервировки стола

Какие игры можно предложить для взрослой компании дома

Как легко запомнить имена людей, которых тебе представили

Авторы
Теги
Магазин исследований Аналитика по теме "Интернет"
Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.
Лента новостей
Курс евро на 5 декабря
EUR ЦБ: 89,9 (-0,69)
Инвестиции, 14:01
Курс доллара на 5 декабря
USD ЦБ: 76,97 (-0,99)
Инвестиции, 14:01
El Pais узнала об осознании в ЕС неизбежности уступок Украиной территорий Политика, 14:11
Бывшая жена Иванова просила его не идти в Минобороны «из-за морали» Политика, 14:11
Как добавить золото в свой портфель: инструкция для инвесторов #всенабиржу!, 14:10
Путин и Моди на сессии бизнес-форума в Индии. Трансляция Политика, 14:05
Путин и Моди приехали на бизнес-форум Политика, 14:04
Баканов пожелал успехов выдвинутому Трампом кандидату на пост главы NASA Политика, 14:02
Какие антиэйдж-технологии в косметологии ждут в ближайшие 5 лет РБК и КИТ МЕД, 14:00
Как заводить полезные знакомства?
Интенсив о нетворкинге
Подробнее
Белорусский биатлонист выиграл масс-старт на этапе Кубка Содружества Спорт, 13:58
Вы имеете дело с инфантильным сотрудником: какие 4 фразы на это указывают Образование, 13:54
Опубликовано совместное заявление Путина и Моди из 70 пунктов Политика, 13:49
Монетизация данных о клиентах: норма или повод для паники РБК и PostgresPro, 13:46
Snapchat заблокировали в России. Что это за мессенджер и почему закрыли Life, 13:44
Венгер назвал главного фаворита ЧМ-2026 Спорт, 13:43
Минцифры снова расширило «белый список» сайтов Технологии и медиа, 13:42