Перейти к основному контенту
Технологии и медиа⁠,
0

OpenAI представила новую версию нейросети GPT-4o

Новая версия ИИ GPT-4o реагирует на голос в среднем за 320 миллисекунд, что сравнимо с реакцией в разговоре. Она «лучше воспринимает изображение и аудио по сравнению с существующими моделями», отмечают разработчики
Основатель OpenAI Сэм Альтман
Основатель OpenAI Сэм Альтман (Фото: Justin Sullivan / Getty Images)

OpenAI представила новую версию генеративного искусственного интеллекта GPT-4o, которая ляжет в основу чат-бота ChatGPT. Буква О означает сокращение от слова omni (всесторонний).

GPT-4o работает с аудио, изображениями и текстом. По словам разработчиков, она реагирует на голос в среднем за 320 миллисекунд, что сравнимо с реакцией в разговоре.

Новая версия соответствует производительности GPT-4 Turbo, но «лучше воспринимает изображение и аудио по сравнению с существующими моделями», отмечает OpenAI.

«До GPT-4o вы могли использовать голосовой режим для общения с ChatGPT со средней задержкой 2,8 секунды (GPT-3.5) и 5,4 секунды (GPT-4). Голосовой режим в этих версиях состоит из трех отдельных моделей: одна простая модель транскрибирует аудио в текст, GPT-3.5 или GPT-4 выводит текст, а третья простая модель преобразовывает этот текст обратно в аудио», — пояснили в компании.

В результате GPT-4 теряет множество информации и не может воспроизводить смех, пение или выражать эмоции. «В случае с GPT-4o мы обучили единую новую модель сквозному анализу текста, изображения и аудио; это означает, что все входные и выходные данные обрабатываются одной и той же нейронной сетью», — рассказали разработчики. Модель доступна более чем на 50 языках, в том числе на русском.

Bloomberg узнал о сделке Apple и OpenAI для внедрения ChatGPT в iPhone
Технологии и медиа
Фото:Andrew Kelly / Reuters

GPT-4o предоставляется пользователям с 13 мая. Однако доступ к голосовым функциям в ближайшие недели появится только у «небольшой группы доверенных партнеров», а в июне — у платных подписчиков.

В конце ноября 2022 года компания OpenAI, одним из основателей которой был Илон Маск, представила универсальный чат-бот ChatGPT.

Этот чат-бот способен вести диалог, искать ошибки в коде, сочинять стихи, писать сценарии и даже спорить. Нейросеть, на основе которой работает ChatGPT, может помимо прочего выдавать базовый программный код, генерировать финансовый анализ, резюме технических статей или научных концепций, прогнозы, персональные советы и дает этичные ответы на любые вопросы. Кроме того, она запоминает детали диалога с пользователем и избегает спорных тем. Наконец, ответы чат-бота можно корректировать с помощью наводящих вопросов.

ChatGPT создавали на суперкомпьютере Azure AI на основе языковой модели GPT-3,5 от OpenAI. Чат-бот обучали с помощью массива текстов из интернета и системы с подкреплением на основе обратной связи с человеком Reinforcement Learning from Human Feedback. Затем нейросеть переобучали несколько раз, используя ее собственные ответы, чтобы сделать последние более точными и корректными. Разработчики заявили, что стремились сделать ИИ простым в использовании, корректным и «человечным».

ChatGPT работает как чат в диалоговом окне. Нейросетью можно пользоваться бесплатно, для этого нужно только зарегистрироваться на сайте OpenAI. Однако пройти верификацию по российскому номеру телефона не получится. Кроме того, сайт заблокировал доступ к чат-боту с российских IP-адресов. Разработчики предлагают также платную подписку ChatGPT Plus, которая гарантирует бесперебойную работу чат-бота даже в часы загруженности. Она стоит $20 в месяц.

В марте 2023 года OpenAI представила новую модель GPT-4. ChatGPT также обновили, добавив фильтры новой модели, которая характеризуется как более точная и этичная. Кроме того, чат-бот начал отвечать на запросы в виде не только текста, но и картинок.

Авторы
Теги
Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.
Лента новостей
Курс евро на 30 декабря
EUR ЦБ: 91,48 (+0,27)
Инвестиции, 29 дек, 17:34
Курс доллара на 30 декабря
USD ЦБ: 77,45 (-0,25)
Инвестиции, 29 дек, 17:34
Как добавить золото в свой портфель: инструкция для инвесторов #всенабиржу!, 14:10
Мосты на границе Литвы с Россией подготовят к минированию Политика, 14:07
Рынок готовой еды в 2026 году: зумеры, регионы и ставка на свежесть Тренды, 14:05
Главгосэкспертиза запустила новый сервис для экспертных организаций Компании, 14:00
Какое ядерное оружие есть у России и США. Инфографика Политика, 13:58
Как изменятся российские законы в 2026 году Общество, 13:58
В Краснодаре при атаке БПЛА пострадали два человека Политика, 13:55
Определите свой тип лидерства
Это займет всего 5 минут
Пройти тест
Доллар в 2025 году показал худший результат среди ведущих мировых валют Инвестиции, 13:54
Песков заявил о невозможности обсуждать публично местонахождение Путина Политика, 13:53
Названный «призраком» рейс «Уральских авиалиний» сел в Екатеринбурге Общество, 13:47
Монетизация данных о клиентах: норма или повод для паники РБК и PostgresPro, 13:46
От лесов до морей: зачем и как бизнес заботится об экологии Тренды, 13:41
В «Динамо» назвали причины назначения Гусева главным тренером Спорт, 13:39
Карьерный рывок: как убрать барьеры на пути к высокой зарплате Образование, 13:39