Новости

GPT-4o анализирует текст, аудио или изображения и дает ответы в чатах в реальном времени.

GPT-4o анализирует текст, аудио или изображения и дает ответы в чатах в реальном времени

С запуском GPT-4o платформа OpenAI ChatGPT стала намного более интерактивной. Эта «флагманская модель» анализирует аудио-, визуальный и/или текстовый ввод, предоставляя ответы посредством разговора в реальном времени с очень похожим на человека ИИ-агентом.

Объявленный в этот понедельник (13 мая) на онлайн-мероприятии, организованном техническим директором OpenAI Мирой Мурати, GPT-4o описывается как «шаг к гораздо более естественному взаимодействию человека и компьютера». Буква «o» в названии означает «omni».

Он нацелен на повышение производительности пользователей бесплатного сервиса и, как утверждается, соответствует производительности платной модели GPT-4 Turbo при обработке ввода текста и кода, а Кроме того, API намного быстрее и на 50 % дешевле (это означает, что его можно интегрировать в сторонние приложения за меньшие деньги).

Пользователи начинают с простой голосовой подсказки «Эй, ChatGPT», получая от агента очень бурный устный ответ. Используя простой разговорный язык, пользователь затем отправляет свой запрос с сопроводительным текстом, аудио и/или визуальными эффектами, если необходимо – последние могут включать фотографии, прямую трансляцию с камеры своего телефона или практически все, что агент может «увидеть».

Когда дело доходит до аудиовходов, ИИ отвечает в среднем за 320 миллисекунд, что, по утверждению компании, аналогично времени реакции человека в разговоре между людьми. Более того, в настоящее время система свободно говорит более чем на 50 языках.

В сегодняшнем анонсе/демонстрации не было неловких задержек в ответах агента, которые определенно содержали много человеческих эмоций – HAL 9000 это не так. Кроме того, пользователи могли прерывать ответы агента, не нарушая двусторонний поток информации.

Помимо прочего, в демо-версии GPT-4o также выступал в качестве переводчика для итальянского языка. английский разговор между двумя людьми; помочь человеку решить рукописное уравнение алгебры; анализ отдельных участков программного кода; и даже импровизировать сказку о роботе на ночь.

GPT-4o уже доступен для общего использования, а в ближайшие несколько недель будет объявлено о новых функциях. Вы можете увидеть и услышать его в видео ниже.

Камень, ножницы, бумага с GPT-4o

Источник

Нажмите, чтобы оценить статью
[Итого: 2 Среднее значение: 5]

Похожие статьи

Добавить комментарий

Ваш адрес email не будет опубликован.

Кнопка «Наверх»