VK открыла доступ к собственным технологиям распознавания речи

. Нейросеть считывает голос человека и переводит его в текст
Обновлено 22 сентября 2022, 13:09
«ВКонтакте»
Фото: «ВКонтакте»

Сторонние разработчики смогут бесплатно использовать технологии распознавания речи «ВКонтакте», которые считывают голос и переводят его в текст. Об этом сообщает пресс-служба социальной сети.

По словам технического директора «ВКонтакте» Александра Тоболя, технология распознавания речи ASR (Automatic Speech Recognition) «внедряется в несколько кликов». Пользователю предлагается выбрать одну из двух моделей: нейтральную и спонтанную. Первая подойдет для разборчивой речи, как, например, в интервью или телешоу, а спонтанная модель пригодится при необходимости обработки повседневной спонтанной речи, в том числе со сленгом и ненормативной лексикой.

Разработчики утверждают, что нейросети «ВКонтакте» обрабатывают файлы всего за несколько секунд, а также умеют удалять из итоговой расшифровки посторонние шумы и паузы. Плюс ко всему искусственный интеллект понимает неразборчивую речь, а также отдельный звук «ъ».

Технологию можно попробовать через веб-интерфейс на специальной странице или интегрировать через публичный API «ВКонтакте». В компании утверждают, что данное решение подойдет для стартапов, инди-проектов, а также личных pet-проектов для самообучения и развития.

Ранее социальная сеть «ВКонтакте» показала существенно обновленный дизайн личного профиля пользователя в мобильном приложении. Основные изменения коснулись управления, которое стало «более простым и интуитивным», а также возможностей оформления обложки.

Поделиться
Авторы
Теги