Сегодня 17 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ-модель GPT-4o — она гораздо умнее старых версий и будет доступна бесплатно

OpenAI представила мощную мультимодальную модель генеративного искусственного интеллекта (ИИ) GPT-4o, которая будет внедрена в её решения для разработчиков и потребителей в течение следующих нескольких недель. Буква «о» в названии GPT-4o означает omni (всесторонний), что указывает на мультимодальность GPT-4o.

 Источник изображений: OpenAI

Источник изображений: OpenAI

Технический директор OpenAI Мира Мурати (Mira Murati) сообщила в ходе презентации продукта в офисе OpenAI в Сан-Франциско (США), что GPT-4o имеет интеллект «уровня GPT-4», но более высокие возможности в работе с текстом и изображениями, а также с аудио. «GPT-4o воспринимает голос, текст и визуальные образы, — сообщила Мурати. — И это невероятно важно, поскольку мы думаем о будущем взаимодействии между нами и машинами».

Её предшественница — GPT-4 Turbo — обучалась на сочетании изображений и текста. Она способна анализировать изображения и текст для выполнения таких задач, как извлечение текста из изображений и даже описание содержимого этих изображений. В свою очередь, в GPT-4o к этим возможностям добавили речь. GPT-4o получил контекстное окно в 128 тысяч токенов.

Сообщается, что GPT-4o позволит значительно улучшить работу ИИ-чат-бота ChatGPT. Последний уже давно поддерживает голосовой режим, в котором ответы чат-бота расшифровываются с использованием модели преобразования текста в речь, но GPT-4o усилит эту функцию, позволяя пользователям взаимодействовать с чат-ботом больше как с помощником. Например, ему можно будет задать вопрос и прервать его, когда он отвечает. По словам OpenAI, модель GPT-4o обеспечивает реагирование «в реальном времени» и может даже улавливать эмоции в голосе пользователя, генерируя в ответ голос «в различных эмоциональных стилях» в соответствии с текущей ситуацией.

GPT-4o также улучшит визуальные возможности ChatGPT. Исходя из предложенной фотографии или экрана рабочего стола, ChatGPT теперь сможет быстро отвечать на сопутствующие вопросы: от «Что происходит в этом программном коде» до «Какую рубашку какого бренда носит этот человек?».

В дальнейшем возможности модели будут расширяться. Если сейчас GPT-4o позволяет, например, переводить сфотографированное меню на другой язык, то в будущем с её помощью ChatGPT сможет «смотреть» спортивную игру в прямом эфире и объяснять вам правила, говорит Мурати.

Начиная с сегодняшнего дня GPT-4o доступна как платным, так и бесплатным пользователям ChatGPT, но для подписчиков платных тарифных планов ChatGPT Plus и Team ограничение на количество сообщений будет «в 5 раз выше». При превышении лимита ChatGPT автоматически переключится на GPT-3.5 у бесплатных пользователей и на GPT-4 у платных.

Бесплатным пользователям ChatGPT при взаимодействии с GPT-4o станут доступны некоторые функции, которые прежде были только у платных подписчиков. В частности, обновлённый чат-бот сможет искать информацию не только в своей ИИ-модели, но также в интернете; анализировать данные и создавать графики; работать с пользовательскими изображениями и файлами; а также лучше помнить прежние взаимодействия с пользователем. Также бесплатные пользователи получат доступ к GPT Store.

OpenAI сообщила, что GPT-4o поддерживает больше языков, с улучшенной производительностью на 50 различных языках. В API OpenAI GPT-4o в два раза быстрее, чем GPT-4 (в частности, GPT-4 Turbo), вдвое дешевле и имеет более высокие лимиты по скорости.

В настоящее время поддержка голосового общения не включена в API GPT-4o для всех клиентов. OpenAI пояснила, что из-за риска неправильного использования планирует впервые запустить в ближайшие недели поддержку новых аудиовозможностей GPT-4o для «небольшой группы доверенных партнёров».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Отечественная соцсеть «Россграм» тихо закрылась, но потом опять «ожила» 2 мин.
В Windows 10 и 11 появилась загадочная пустая папка — Microsoft объяснила, зачем она нужна 5 ч.
«Игра выглядит всё лучше и лучше»: геймеров впечатлил трейлер экспериментального оружия в ретрошутере Mouse: P.I. For Hire 6 ч.
OpenAI выпустила o3 и o4-mini — самые мощные рассуждающие модели, которые умеют «думать» картинками 7 ч.
Игровой ИИ-помощник от Microsoft стал доступен сотрудникам Xbox — подробности тестовой версии Copilot for Gaming 8 ч.
«Ведьмаки в ловушки не попадаются»: CD Projekt Red предупредила игроков о мошенниках, которые приглашают на «бету» The Witcher 4 9 ч.
11 bit studios подтвердила разработку двух новых игр, включая следующую Frostpunk 10 ч.
«Станет тем, чем должна была быть The Callisto Protocol»: геймплейный трейлер Cronos: The New Dawn от авторов ремейка Silent Hill 2 заинтриговал игроков 11 ч.
Microsoft позволила Copilot Studio самостоятельно управлять компьютером по заданию пользователя 11 ч.
ИИ помог Google заблокировать более 39 млн подозрительных рекламных аккаунтов 13 ч.
Санкции не помеха: Huawei продолжает получать 7-нм чипы от TSMC через посредников 7 мин.
Новая статья: Обзор видеокарты MSI GeForce RTX 5080 Vanguard SOC, в котором она сравнивается с RTX 4080 SUPER в 20 популярных играх 2 ч.
Новая статья: Обзор ноутбука Digma Pro Pactos 16: дисплей, сборка, эффективность 4 ч.
Исследование Honor: из-за распространения дипфейков работодатели изменят способ проведения онлайн-собеседований 4 ч.
Суперускоритель Huawei CloudMatrix 384 оказалася быстрее NVIDIA GB200 NVL72, но значительно прожорливее 5 ч.
Новая статья: Расширяя границы возможностей: обзор российских студенческих разработок в сфере искусственного интеллекта 5 ч.
Microsoft выпустила «адские» контроллеры и чехол для Xbox Series X в стиле Doom: The Dark Ages 6 ч.
iPhone 6s официально стал винтажным 6 ч.
Голландцы установили мировой рекорд по скорости передачи данных по воздуху инфракрасным лучом 8 ч.
Будущая AR-гарнитура Apple Vision Air получит лёгкий титановый корпус 8 ч.