Перейти к основному контенту
Бизнес⁠,
0

Компания Бекмамбетова начала «клонировать» голоса знаменитостей

Проект Vera Voice занимается развитием нейросети, которая будет способна воспроизводить голоса знаменитостей на русском языке. Ранее Сбербанк заявлял об опасности мошенничества с помощью таких технологий
Тимур Бекмамбетов
Тимур Бекмамбетов (Фото: Евгений Биятов / РИА Новости)

Screenlife Technologies, компания продюсера Тимура Бекмамбетова, и «Стафори» (разработчик HR-сервиса на основе искусственного интеллекта «Робот Вера», в которую инвестирует ФРИИ), создают совместное предприятие для развития проекта Vera Voice. Об этом говорится в поступившем в РБК сообщении компаний.

Проект Vera Voice позволит воспроизводить голоса знаменитостей на русском языке. Он основан на технологии нейросети, которая обучается копировать речь на примере оригинала. Стоимость разработки основатели не назвали.

В России уже реализовывались подобные проекты. В частности, инвестором в подобные технологии является Сбербанк: учрежденная банком в 2013 году компания АБК в январе представила короткий ролик с синтезированным голосом актера Иннокентия Смоктуновского. На нем голос актера произносит: «Прослушав всего около 18 часов записи великого артиста, нейронная сеть теперь способна говорить его голосом».

После этого Сбербанк представил технологию на Российском инвестиционном форуме в Сочи. Зампред правления банка Станислав Кузнецов отметил, что подобные проекты могут использоваться и с незаконными целями. В качестве примера он включил запись, на которой некий вымышленный губернатор голосом Смоктуновского просит 5 млрд руб. на постройку моста.

Открытый алгоритм для синтеза человеческой речи с помощью нейросети под названием WaveNet еще в 2016 году представила принадлежащая Google компания DeepMind. На Западе подобные технологии «клонирования» голоса уже активно применяются: в июле 2019 года инженеры Facebook представили синтезатор речи, который, в частности, сгенерировал голос основателя Microsoft Билла Гейтса. В сентябре Amazon объявил, что голосовая колонка компании — Alexa — сможет разговаривать голосами знаменитостей. Первым стал актер Самуэль Ли Джексон. По оценке консалтинговой компании Markets&Markets, к 2023 году рынок клонирования голоса достигнет $1,73 млрд.

«Как и многие стартапы на русском языке — это клон уже существующей идеи. Есть разделы проблем машинного обучения, связанные с языком, для которых можно делать продукт на локальном рынке по образу и подобию англоязычных. Главное собрать достаточно большую выборку данных на нужном языке. В РФ этим занимаются такие гиганты как Яндекс и Сбербанк. Но для узких задач есть место и мелким игрокам», — заявил РБК российский специалист по data science Павел Плесков.

Индустрия развлечений может быть главным применением для такой технологии, добавил он. «Мошенничество — это самая главная угроза. «Синтезировать голос можно уже по семплу длиной в три секунды. А при текущей популярности робоколов (robocall — автоматический звонок. — РБК) «поделиться» со злоумышленниками таким семплом можно, просто сказав: «Алло! По какому вопросу звоните? С кем я разговариваю?» Дальше мошенники смогут, например, пройти авторизацию в банке по голосу», — пояснил он.

Генерацию голоса из текста старой задачей назвал и специалист компании ESR Labs AG из Германии Дмитрий Шефтелович. «Что касается «клонирования» голоса, то, как и во всех задачах машинного обучения, количество данных играет определяющую роль: для профессионального генерирования речи не так давно требовалось несколько часов записей определенной формы. На данный момент существуют реализации, которым хватает только нескольких секунд необязательно профессионально записанной речи, чтобы «научиться» голосу», — считает специалист.

«Синтез голосов знаменитостей — часть всеобщего интереса к «эмоциональному искусственному интеллекту», когда компании-разработчики пытаются добиться от роботов более естественного звучания, чтобы они не вызывали отторжения у клиентов и пользователей», — заявил РБК гендиректор группы компаний «Центр речевых технологий» Дмитрий Дырмовский. Он отметил, что у данной технологии может быть достаточно широкое применение — от озвучивания книг до маркетинговых компаний с голосами знаменитостей. В то же время синтез голоса может использоваться в ложной рекламе или для фальсификации новостей, отметил Дырмовский.

Чем поможет ИИ от Сбера?

Попробуйте новую функцию «ГигаЧат» — общаться голосом

Какое вино подать к ужину, если не знаешь предпочтения гостей

Как приготовить говядину в вине по-бургундски                         

Чем занять детей, пока взрослые общаются за столом

Как легко завести разговор в компании, где все только что познакомились

О чём надо позаботиться, если собираешься позвать много гостей

Из каких сыров и ветчин собрать тарелку закусок к вину

Что делать, если пролил красное вино на белую скатерть

Какие есть правила классической сервировки стола

Какие игры можно предложить для взрослой компании дома

Как легко запомнить имена людей, которых тебе представили

Авторы
Теги
Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.
Лента новостей
Курс евро на 6 декабря
EUR ЦБ: 88,7 (-1,2)
Инвестиции, 15:56
Курс доллара на 6 декабря
USD ЦБ: 76,09 (-0,88)
Инвестиции, 15:56
Что происходит с рынком промышленной автоматизации России Тренды, 16:23
Устойчивое строительство: как уменьшить нагрузку на энергосистему и ЖКХ Отрасли, 16:19
Онлайн и офлайн в одной корзине: что такое бесшовный шопинг сегодня Стиль, 16:19
Кухня — главное место в доме. Как переосмыслили советские традиции РБК и Legenda, 16:19
Военная операция на Украине. Онлайн Политика, 16:19
Банкир из Euroclear попал под подозрение из-за 155 поездок в Россию Политика, 16:12
Российская теннисистка объяснила амбициями переход под флаг Узбекистана Спорт, 16:08
Как заводить полезные знакомства?
Интенсив о нетворкинге
Подробнее
В Испании 17-летний чемпион по мотокроссу погиб во время тренировки Спорт, 16:00
Главный актив года: стратегии ведущих управляющих на рынке ОФЗ #всенабиржу!, 16:00
Sky News узнал о визите Зеленского в Брюссель после переговоров в Лондоне Политика, 15:59
Polymarket: шансы появления крипторезерва в США в 2025 году упали на 98% Крипто, 15:54
Профсоюзы решили объявить забастовку сотрудников Лувра Общество, 15:53
Простота и отсутствие вычурности: каким будет новый жилой дом от TATE РБК и TATE, 15:51
Аналитики зафиксировали снижение интереса к акциям трезвости в мире Вино, 15:41