Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.
Лента новостей
Что читать зимой. 10 долгожданных новинок Life, 00:04
ЦИАН назвал регионы, где за год сильнее всего подорожала земля под ИЖС Недвижимость, 00:03
США одобрили продажу танков и вертолетов на $5 млрд Польше и Южной Корее Политика, 00:00
Эксперты предсказали двукратное сокращение сборов в инвестстраховании Финансы, 00:00
Покупатель заводов Fazer заявил о «воровстве или идиотизме» в компании Бизнес, 00:00
Сборную Бразилии обвинили в неуважении к сопернику. Что произошло Спорт, 00:00
Заменивший Роналду игрок вывел Португалию в четвертьфинал. Главное на ЧМ Спорт, 06 дек, 23:59
Объясняем, что значат новости
Вечерняя рассылка РБК
Подписаться
В поисках пружины саморазвития ребенка: что определяет стратегию РБК и AFI Park Воронцовский, 06 дек, 23:58
Стали известны все пары 1/4 финала чемпионата мира по футболу Спорт, 06 дек, 23:54
Сборная Португалии разгромила Швейцарию и вышла в четвертьфинал ЧМ Спорт, 06 дек, 23:54
Суд приговорил экс-президента Аргентины Кристину Киршнер к 6 годам тюрьмы Политика, 06 дек, 23:52
Песков заявил, что спецслужбы Запада никогда не оставляли Россию в покое Политика, 06 дек, 23:39
В ряде областей Украины объявили воздушную тревогу Политика, 06 дек, 23:36
Образование будущего: технологии, качество и новые перспективы Специальный проект, 06 дек, 23:29
Вклад «Лучший %»
Сумма
Срок
Ваш доход
0
Ставка
0%

Реклама, Рекламодатель ПАО Сбербанк.

Предварительный расчет по повышенной ставке. Не является публичной офертой.

Бизнес ,  
0 

Компания Бекмамбетова начала «клонировать» голоса знаменитостей

Проект Vera Voice занимается развитием нейросети, которая будет способна воспроизводить голоса знаменитостей на русском языке. Ранее Сбербанк заявлял об опасности мошенничества с помощью таких технологий
Тимур Бекмамбетов
Тимур Бекмамбетов (Фото: Евгений Биятов / РИА Новости)

Screenlife Technologies, компания продюсера Тимура Бекмамбетова, и «Стафори» (разработчик HR-сервиса на основе искусственного интеллекта «Робот Вера», в которую инвестирует ФРИИ), создают совместное предприятие для развития проекта Vera Voice. Об этом говорится в поступившем в РБК сообщении компаний.

Проект Vera Voice позволит воспроизводить голоса знаменитостей на русском языке. Он основан на технологии нейросети, которая обучается копировать речь на примере оригинала. Стоимость разработки основатели не назвали.

В России уже реализовывались подобные проекты. В частности, инвестором в подобные технологии является Сбербанк: учрежденная банком в 2013 году компания АБК в январе представила короткий ролик с синтезированным голосом актера Иннокентия Смоктуновского. На нем голос актера произносит: «Прослушав всего около 18 часов записи великого артиста, нейронная сеть теперь способна говорить его голосом».

После этого Сбербанк представил технологию на Российском инвестиционном форуме в Сочи. Зампред правления банка Станислав Кузнецов отметил, что подобные проекты могут использоваться и с незаконными целями. В качестве примера он включил запись, на которой некий вымышленный губернатор голосом Смоктуновского просит 5 млрд руб. на постройку моста.

Открытый алгоритм для синтеза человеческой речи с помощью нейросети под названием WaveNet еще в 2016 году представила принадлежащая Google компания DeepMind. На Западе подобные технологии «клонирования» голоса уже активно применяются: в июле 2019 года инженеры Facebook представили синтезатор речи, который, в частности, сгенерировал голос основателя Microsoft Билла Гейтса. В сентябре Amazon объявил, что голосовая колонка компании — Alexa — сможет разговаривать голосами знаменитостей. Первым стал актер Самуэль Ли Джексон. По оценке консалтинговой компании Markets&Markets, к 2023 году рынок клонирования голоса достигнет $1,73 млрд.

«Как и многие стартапы на русском языке — это клон уже существующей идеи. Есть разделы проблем машинного обучения, связанные с языком, для которых можно делать продукт на локальном рынке по образу и подобию англоязычных. Главное собрать достаточно большую выборку данных на нужном языке. В РФ этим занимаются такие гиганты как Яндекс и Сбербанк. Но для узких задач есть место и мелким игрокам», — заявил РБК российский специалист по data science Павел Плесков.

Индустрия развлечений может быть главным применением для такой технологии, добавил он. «Мошенничество — это самая главная угроза. «Синтезировать голос можно уже по семплу длиной в три секунды. А при текущей популярности робоколов (robocall — автоматический звонок. — РБК) «поделиться» со злоумышленниками таким семплом можно, просто сказав: «Алло! По какому вопросу звоните? С кем я разговариваю?» Дальше мошенники смогут, например, пройти авторизацию в банке по голосу», — пояснил он.

Генерацию голоса из текста старой задачей назвал и специалист компании ESR Labs AG из Германии Дмитрий Шефтелович. «Что касается «клонирования» голоса, то, как и во всех задачах машинного обучения, количество данных играет определяющую роль: для профессионального генерирования речи не так давно требовалось несколько часов записей определенной формы. На данный момент существуют реализации, которым хватает только нескольких секунд необязательно профессионально записанной речи, чтобы «научиться» голосу», — считает специалист.

«Синтез голосов знаменитостей — часть всеобщего интереса к «эмоциональному искусственному интеллекту», когда компании-разработчики пытаются добиться от роботов более естественного звучания, чтобы они не вызывали отторжения у клиентов и пользователей», — заявил РБК гендиректор группы компаний «Центр речевых технологий» Дмитрий Дырмовский. Он отметил, что у данной технологии может быть достаточно широкое применение — от озвучивания книг до маркетинговых компаний с голосами знаменитостей. В то же время синтез голоса может использоваться в ложной рекламе или для фальсификации новостей, отметил Дырмовский.

Авторы
Теги
Вклад «Лучший %»
Сумма
Срок
Ваш доход
0
Ставка
0%

Реклама, Рекламодатель ПАО Сбербанк.

Предварительный расчет по повышенной ставке. Не является публичной офертой.