Перейти к основному контенту
Технологии и медиа⁠,
0

OpenAI представила новую версию нейросети GPT-4o

Новая версия ИИ GPT-4o реагирует на голос в среднем за 320 миллисекунд, что сравнимо с реакцией в разговоре. Она «лучше воспринимает изображение и аудио по сравнению с существующими моделями», отмечают разработчики
Основатель OpenAI Сэм Альтман
Основатель OpenAI Сэм Альтман (Фото: Justin Sullivan / Getty Images)

OpenAI представила новую версию генеративного искусственного интеллекта GPT-4o, которая ляжет в основу чат-бота ChatGPT. Буква О означает сокращение от слова omni (всесторонний).

GPT-4o работает с аудио, изображениями и текстом. По словам разработчиков, она реагирует на голос в среднем за 320 миллисекунд, что сравнимо с реакцией в разговоре.

Новая версия соответствует производительности GPT-4 Turbo, но «лучше воспринимает изображение и аудио по сравнению с существующими моделями», отмечает OpenAI.

«До GPT-4o вы могли использовать голосовой режим для общения с ChatGPT со средней задержкой 2,8 секунды (GPT-3.5) и 5,4 секунды (GPT-4). Голосовой режим в этих версиях состоит из трех отдельных моделей: одна простая модель транскрибирует аудио в текст, GPT-3.5 или GPT-4 выводит текст, а третья простая модель преобразовывает этот текст обратно в аудио», — пояснили в компании.

В результате GPT-4 теряет множество информации и не может воспроизводить смех, пение или выражать эмоции. «В случае с GPT-4o мы обучили единую новую модель сквозному анализу текста, изображения и аудио; это означает, что все входные и выходные данные обрабатываются одной и той же нейронной сетью», — рассказали разработчики. Модель доступна более чем на 50 языках, в том числе на русском.

Bloomberg узнал о сделке Apple и OpenAI для внедрения ChatGPT в iPhone
Технологии и медиа
Фото:Andrew Kelly / Reuters

GPT-4o предоставляется пользователям с 13 мая. Однако доступ к голосовым функциям в ближайшие недели появится только у «небольшой группы доверенных партнеров», а в июне — у платных подписчиков.

В конце ноября 2022 года компания OpenAI, одним из основателей которой был Илон Маск, представила универсальный чат-бот ChatGPT.

Этот чат-бот способен вести диалог, искать ошибки в коде, сочинять стихи, писать сценарии и даже спорить. Нейросеть, на основе которой работает ChatGPT, может помимо прочего выдавать базовый программный код, генерировать финансовый анализ, резюме технических статей или научных концепций, прогнозы, персональные советы и дает этичные ответы на любые вопросы. Кроме того, она запоминает детали диалога с пользователем и избегает спорных тем. Наконец, ответы чат-бота можно корректировать с помощью наводящих вопросов.

ChatGPT создавали на суперкомпьютере Azure AI на основе языковой модели GPT-3,5 от OpenAI. Чат-бот обучали с помощью массива текстов из интернета и системы с подкреплением на основе обратной связи с человеком Reinforcement Learning from Human Feedback. Затем нейросеть переобучали несколько раз, используя ее собственные ответы, чтобы сделать последние более точными и корректными. Разработчики заявили, что стремились сделать ИИ простым в использовании, корректным и «человечным».

ChatGPT работает как чат в диалоговом окне. Нейросетью можно пользоваться бесплатно, для этого нужно только зарегистрироваться на сайте OpenAI. Однако пройти верификацию по российскому номеру телефона не получится. Кроме того, сайт заблокировал доступ к чат-боту с российских IP-адресов. Разработчики предлагают также платную подписку ChatGPT Plus, которая гарантирует бесперебойную работу чат-бота даже в часы загруженности. Она стоит $20 в месяц.

В марте 2023 года OpenAI представила новую модель GPT-4. ChatGPT также обновили, добавив фильтры новой модели, которая характеризуется как более точная и этичная. Кроме того, чат-бот начал отвечать на запросы в виде не только текста, но и картинок.

Чем поможет ИИ от Сбера?

Попробуйте новую функцию «ГигаЧат» — общаться голосом

Какое вино подать к ужину, если не знаешь предпочтения гостей

Как приготовить говядину в вине по-бургундски                         

Чем занять детей, пока взрослые общаются за столом

Как легко завести разговор в компании, где все только что познакомились

О чём надо позаботиться, если собираешься позвать много гостей

Из каких сыров и ветчин собрать тарелку закусок к вину

Что делать, если пролил красное вино на белую скатерть

Какие есть правила классической сервировки стола

Какие игры можно предложить для взрослой компании дома

Как легко запомнить имена людей, которых тебе представили

Авторы
Теги
Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.
Лента новостей
Курс евро на 5 декабря
EUR ЦБ: 89,9 (-0,69)
Инвестиции, 16:41
Курс доллара на 5 декабря
USD ЦБ: 76,97 (-0,99)
Инвестиции, 16:41
FT включила Маргариту Симоньян в список влиятельнейших людей года Политика, 17:06
«Галс-Девелопмент» провел публичную дискуссию на тему «Дом как судьба» Пресс-релиз, 17:05
Путин начал встречу с президентом Индии Политика, 17:04
ГАИ опровергла планы ужесточить регистрацию авто с большим пробегом Общество, 17:01
Биткоин-ETF BlackRock потерял $2,7 млрд из-за рекордного оттока средств Крипто, 16:58
Расслабленная жизнь как на курорте: каким будет квартал Dream Riva РБК и Dream Riva, 16:55
Макрон признал, что ЕС не принудит Россию к переговорам с ним по Украине Политика, 16:50
ИИ для работы и жизни — новый интенсив РБК
Как пользоваться нейросетями и прокачать с ними общение
Подробнее
Золотые резервы России впервые превысили $300 млрд Экономика, 16:50
На Украине в вузах и колледжах нашли 50 тыс. уклонистов от мобилизации Политика, 16:46
Акции «Башнефти» упали на планах Башкирии продать часть госпакета Инвестиции, 16:45
В зоне доступа: как транспортная инфраструктура влияет на бизнес 16:40
Как устроена экономика Ирана РБК и РЭЦ, 16:37
Эксперты зафиксировали максимальный за четыре года ввод ТЦ в России Недвижимость, 16:36
Объем сделок на платформах криптопрогнозов вырос до рекордных $8,3 млрд Крипто, 16:26