Перейти к основному контенту
Бизнес ,  
0 

Компания Бекмамбетова начала «клонировать» голоса знаменитостей

Проект Vera Voice занимается развитием нейросети, которая будет способна воспроизводить голоса знаменитостей на русском языке. Ранее Сбербанк заявлял об опасности мошенничества с помощью таких технологий
Тимур Бекмамбетов
Тимур Бекмамбетов (Фото: Евгений Биятов / РИА Новости)

Screenlife Technologies, компания продюсера Тимура Бекмамбетова, и «Стафори» (разработчик HR-сервиса на основе искусственного интеллекта «Робот Вера», в которую инвестирует ФРИИ), создают совместное предприятие для развития проекта Vera Voice. Об этом говорится в поступившем в РБК сообщении компаний.

Проект Vera Voice позволит воспроизводить голоса знаменитостей на русском языке. Он основан на технологии нейросети, которая обучается копировать речь на примере оригинала. Стоимость разработки основатели не назвали.

В России уже реализовывались подобные проекты. В частности, инвестором в подобные технологии является Сбербанк: учрежденная банком в 2013 году компания АБК в январе представила короткий ролик с синтезированным голосом актера Иннокентия Смоктуновского. На нем голос актера произносит: «Прослушав всего около 18 часов записи великого артиста, нейронная сеть теперь способна говорить его голосом».

После этого Сбербанк представил технологию на Российском инвестиционном форуме в Сочи. Зампред правления банка Станислав Кузнецов отметил, что подобные проекты могут использоваться и с незаконными целями. В качестве примера он включил запись, на которой некий вымышленный губернатор голосом Смоктуновского просит 5 млрд руб. на постройку моста.

Открытый алгоритм для синтеза человеческой речи с помощью нейросети под названием WaveNet еще в 2016 году представила принадлежащая Google компания DeepMind. На Западе подобные технологии «клонирования» голоса уже активно применяются: в июле 2019 года инженеры Facebook представили синтезатор речи, который, в частности, сгенерировал голос основателя Microsoft Билла Гейтса. В сентябре Amazon объявил, что голосовая колонка компании — Alexa — сможет разговаривать голосами знаменитостей. Первым стал актер Самуэль Ли Джексон. По оценке консалтинговой компании Markets&Markets, к 2023 году рынок клонирования голоса достигнет $1,73 млрд.

«Как и многие стартапы на русском языке — это клон уже существующей идеи. Есть разделы проблем машинного обучения, связанные с языком, для которых можно делать продукт на локальном рынке по образу и подобию англоязычных. Главное собрать достаточно большую выборку данных на нужном языке. В РФ этим занимаются такие гиганты как Яндекс и Сбербанк. Но для узких задач есть место и мелким игрокам», — заявил РБК российский специалист по data science Павел Плесков.

Индустрия развлечений может быть главным применением для такой технологии, добавил он. «Мошенничество — это самая главная угроза. «Синтезировать голос можно уже по семплу длиной в три секунды. А при текущей популярности робоколов (robocall — автоматический звонок. — РБК) «поделиться» со злоумышленниками таким семплом можно, просто сказав: «Алло! По какому вопросу звоните? С кем я разговариваю?» Дальше мошенники смогут, например, пройти авторизацию в банке по голосу», — пояснил он.

Генерацию голоса из текста старой задачей назвал и специалист компании ESR Labs AG из Германии Дмитрий Шефтелович. «Что касается «клонирования» голоса, то, как и во всех задачах машинного обучения, количество данных играет определяющую роль: для профессионального генерирования речи не так давно требовалось несколько часов записей определенной формы. На данный момент существуют реализации, которым хватает только нескольких секунд необязательно профессионально записанной речи, чтобы «научиться» голосу», — считает специалист.

«Синтез голосов знаменитостей — часть всеобщего интереса к «эмоциональному искусственному интеллекту», когда компании-разработчики пытаются добиться от роботов более естественного звучания, чтобы они не вызывали отторжения у клиентов и пользователей», — заявил РБК гендиректор группы компаний «Центр речевых технологий» Дмитрий Дырмовский. Он отметил, что у данной технологии может быть достаточно широкое применение — от озвучивания книг до маркетинговых компаний с голосами знаменитостей. В то же время синтез голоса может использоваться в ложной рекламе или для фальсификации новостей, отметил Дырмовский.

Раскрой экосистему TECNO

Флагманские технологии 
для продуктивной жизни

Съемка фото и видео 
на профессиональном уровне

Производительность 
и максимально выносливый аккумулятор

Яркий дизайн 
и сбалансированные характеристики

Легкость и мощность для любых задач

Чистый звук и улучшенная эргономика

Авторы
Теги
Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.
00 часов : 00 минут : 00 секунд
00 дней


 

.

Лента новостей
Курс евро на 9 мая
EUR ЦБ: 98,95 (+0,64)
Инвестиции, 08 мая, 16:17
Курс доллара на 9 мая
USD ЦБ: 91,82 (+0,7)
Инвестиции, 08 мая, 16:17
Как Москва отпраздновала День Победы. Фоторепортаж Общество, 20:09 
Хоккеисты «России 25» в третий раз победили белорусов в майском турне Спорт, 20:06
В Курской области при обстреле погибла женщина Политика, 19:44
В Хельсинки облили краской памятник советским военным Политика, 19:39
Турецкая федерация хоккея сообщила о планах заявить свой клуб в КХЛ Спорт, 19:30
В Армении оппозиция выдвинула Пашиняну ультиматум Политика, 19:27
Умер основатель фирмы, ставшей источником «Панамского досье» Политика, 19:19
Говорим красиво и убедительно
Видеоуроки В. Вишневского и 40 других курсов в Уроках Легенд
Подробнее
Российский каноист завоевал лицензию на Олимпиаду Спорт, 19:06
Женщина погибла при обстреле белгородского села Новая Таволжанка Политика, 19:03
Клуб РПЛ опроверг возможность отставки тренера из-за «внутренних дрязг» Спорт, 19:03
Эстония расторгнет договор с Россией о сотрудничестве в образовании Политика, 18:51
Туск рассказал о присутствии военных специалистов НАТО на Украине Политика, 18:31
В центре Москвы из-за майского снегопада упала «допетровская ива» Общество, 18:24
Надаль за три часа обыграл 108-ю ракетку мира на старте «Мастерса» в Риме Спорт, 18:16