Перейти к основному контенту
Технологии и медиа⁠,
0

OpenAI представила новую версию нейросети GPT-4o

Новая версия ИИ GPT-4o реагирует на голос в среднем за 320 миллисекунд, что сравнимо с реакцией в разговоре. Она «лучше воспринимает изображение и аудио по сравнению с существующими моделями», отмечают разработчики
Основатель OpenAI Сэм Альтман
Основатель OpenAI Сэм Альтман (Фото: Justin Sullivan / Getty Images)

OpenAI представила новую версию генеративного искусственного интеллекта GPT-4o, которая ляжет в основу чат-бота ChatGPT. Буква О означает сокращение от слова omni (всесторонний).

GPT-4o работает с аудио, изображениями и текстом. По словам разработчиков, она реагирует на голос в среднем за 320 миллисекунд, что сравнимо с реакцией в разговоре.

Новая версия соответствует производительности GPT-4 Turbo, но «лучше воспринимает изображение и аудио по сравнению с существующими моделями», отмечает OpenAI.

«До GPT-4o вы могли использовать голосовой режим для общения с ChatGPT со средней задержкой 2,8 секунды (GPT-3.5) и 5,4 секунды (GPT-4). Голосовой режим в этих версиях состоит из трех отдельных моделей: одна простая модель транскрибирует аудио в текст, GPT-3.5 или GPT-4 выводит текст, а третья простая модель преобразовывает этот текст обратно в аудио», — пояснили в компании.

В результате GPT-4 теряет множество информации и не может воспроизводить смех, пение или выражать эмоции. «В случае с GPT-4o мы обучили единую новую модель сквозному анализу текста, изображения и аудио; это означает, что все входные и выходные данные обрабатываются одной и той же нейронной сетью», — рассказали разработчики. Модель доступна более чем на 50 языках, в том числе на русском.

Bloomberg узнал о сделке Apple и OpenAI для внедрения ChatGPT в iPhone
Технологии и медиа
Фото:Andrew Kelly / Reuters

GPT-4o предоставляется пользователям с 13 мая. Однако доступ к голосовым функциям в ближайшие недели появится только у «небольшой группы доверенных партнеров», а в июне — у платных подписчиков.

В конце ноября 2022 года компания OpenAI, одним из основателей которой был Илон Маск, представила универсальный чат-бот ChatGPT.

Этот чат-бот способен вести диалог, искать ошибки в коде, сочинять стихи, писать сценарии и даже спорить. Нейросеть, на основе которой работает ChatGPT, может помимо прочего выдавать базовый программный код, генерировать финансовый анализ, резюме технических статей или научных концепций, прогнозы, персональные советы и дает этичные ответы на любые вопросы. Кроме того, она запоминает детали диалога с пользователем и избегает спорных тем. Наконец, ответы чат-бота можно корректировать с помощью наводящих вопросов.

ChatGPT создавали на суперкомпьютере Azure AI на основе языковой модели GPT-3,5 от OpenAI. Чат-бот обучали с помощью массива текстов из интернета и системы с подкреплением на основе обратной связи с человеком Reinforcement Learning from Human Feedback. Затем нейросеть переобучали несколько раз, используя ее собственные ответы, чтобы сделать последние более точными и корректными. Разработчики заявили, что стремились сделать ИИ простым в использовании, корректным и «человечным».

ChatGPT работает как чат в диалоговом окне. Нейросетью можно пользоваться бесплатно, для этого нужно только зарегистрироваться на сайте OpenAI. Однако пройти верификацию по российскому номеру телефона не получится. Кроме того, сайт заблокировал доступ к чат-боту с российских IP-адресов. Разработчики предлагают также платную подписку ChatGPT Plus, которая гарантирует бесперебойную работу чат-бота даже в часы загруженности. Она стоит $20 в месяц.

В марте 2023 года OpenAI представила новую модель GPT-4. ChatGPT также обновили, добавив фильтры новой модели, которая характеризуется как более точная и этичная. Кроме того, чат-бот начал отвечать на запросы в виде не только текста, но и картинок.

Чем поможет ИИ от Сбера?

Попробуйте новую функцию «ГигаЧат» — общаться голосом

Какое вино подать к ужину, если не знаешь предпочтения гостей

Как приготовить говядину в вине по-бургундски                         

Чем занять детей, пока взрослые общаются за столом

Как легко завести разговор в компании, где все только что познакомились

О чём надо позаботиться, если собираешься позвать много гостей

Из каких сыров и ветчин собрать тарелку закусок к вину

Что делать, если пролил красное вино на белую скатерть

Какие есть правила классической сервировки стола

Какие игры можно предложить для взрослой компании дома

Как легко запомнить имена людей, которых тебе представили

Авторы
Теги
Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.
Лента новостей
Курс евро на 6 декабря
EUR ЦБ: 88,7 (-1,2)
Инвестиции, 23:31
Курс доллара на 6 декабря
USD ЦБ: 76,09 (-0,88)
Инвестиции, 23:31
Почему к косметическим процедурам стоит добавить биотехнологии РБК и КИТ МЕД, 23:30
Большой театр анонсировал старт продаж на январские показы «Щелкунчика» Общество, 23:24
The Altantic рассказал о странном исчезновении борца с супер-ИИ в США Технологии и медиа, 23:21
Трамп исполнил свой танец на жеребьевке ЧМ по футболу Спорт, 23:10
Россия и Иран: история сотрудничества РБК и РЭЦ, 23:00
Politico узнало, что Венгрия оставила ЕС без «плана Б» по активам России Политика, 22:54
Зеленский исключил Ермака из СНБО и своей ставки Политика, 22:52
Курс Мини-MBA: рост для лидеров
Старт потока 8 декабря
Присоединиться
Аэропорт Тамбова временно приостановил полеты Политика, 22:48
Что умеет видеоаналитика на производстве и в ретейле РБК х МТС Бизнес, 22:46
Bentley подтвердила отзыв кроссоверов Bentayga из-за перегрева батареи Общество, 22:41
Умер архитектор Фрэнк Гери Общество, 22:30
Почему Египет импортирует продукты питания РБК и РЭЦ, 22:23
Какие сборные вышли на чемпионат мира по футболу 2026 года Спорт, 22:19
Лариса Долина пообещала вернуть деньги купившей ее квартиру Полине Лурье Общество, 22:14