OpenAI представила нейросеть для копирования голоса человека

. Новый инструмент от создателей ChatGPT получил название Voice Engine

OpenAI представила нейросеть Voice Engine для копирования голоса человека

Обновлено 01 апреля 2024, 11:43
Shutterstock
Фото: Shutterstock

Компания OpenAI представила нейросеть Voice Engine, которая способна воссоздать голос любого человека на основе 15-секундного аудиопримера.

Разработка позволит озвучить текст на различных языках с помощью «клонированного» голоса. Для этого достаточно предоставить короткий 15-секундный образец голоса человека, который нужно воссоздать, и ввести в сервисе текст, который требуется озвучить.

Разработчики OpenAI считают, что технология будет полезна для восстановления голоса у людей, потерявших его. В то же время нейросеть таит в себе немало потенциальных угроз и может стать еще одним орудием мошенников. Впрочем, сами создатели инструмента уверяют, что «внедрили ряд мер безопасности, в том числе водяные знаки, для отслеживания происхождения всякого звука, генерируемого Voice Engine, а также мониторинг того, как используется модель».

В OpenAI также рассказали, что разработка Voice Engine началась в конце 2022 года и в процессе обучения модели использовались как лицензированные, так и открытые данные. На данный момент сервис не является общедоступным. Когда его откроют для широкой публики, не сообщается.

Незадолго до этого ученые из России и Германии создали приложение на базе искусственного интеллекта, которое позволяет управлять музыкой. С помощью голосовых команд, жестов или мимики пользователь может попросить программу воспроизвести мелодию абсолютно по-другому, создавая, таким образом, уникальные варианты произведения.

Поделиться