Сегодня 17 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Президент OpenAI опубликовал изображение, созданное GPT-4o — оно очень впечатляет

На этой неделе OpenAI представила модель искусственного интеллекта нового поколения GPT-4o. Буква «o» в её названии означает Omni, подразумевая, что она изначально поддерживает несколько форматов ввода — ранее мультимодальность предполагала преобразование всех нетекстовых форматов в текст. Президент и соучредитель OpenAI Грег Брокман (Greg Brockman) впервые опубликовал созданное GPT-4o изображение.

 Источник изображения: twitter.com/gdb

То самое сгенерированное GPT-4o изображение. Источник изображения: twitter.com/gdb

Поддержка текста, изображений и звука в качестве входных данных означает, что модель также способна их генерировать. Приведённая выше картинка — не фотография, а творение GPT-4o. На ней изображён мужчина в футболке с логотипом OpenAI, который пишет на доске. Сверху находится частично стёртая надпись «Перенос между модальностями». Далее следует текст: «Положим, мы напрямую моделируем P (текст, пиксели, звук) посредством одного авторегрессионного трансформера. Каковы за и против?».

Если присмотреться, можно разглядеть некоторые признаки того, что изображение было создано ИИ. Доска висит под неестественным углом, под ней непонятным образом находится ещё одна, рука мужчины имеет странную форму, а освещение неоднородно. Невероятной, вместе с тем, кажется способность ИИ генерировать длинные фрагменты связного текста — с этим с трудом справляется даже DALL-E 3. Генератор изображений GPT-4o широкой публике пока недоступен: пользователи ChatGPT с подключённой моделью нового поколения пока могут генерировать изображения лишь с DALL-E 3. Но президент OpenAI Грег Брокман уверяет, что компания прилагает значительные усилия, чтобы открыть к модели нового поколения полный доступ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Subnautica 2 — хорошо на дне морском. Предварительный обзор 3 ч.
Acronis представила платформу Cyber Frame — альтернативу продуктам VMware 4 ч.
Microsoft разрешит менять положение панели задач и размер меню «Пуск» в Windows 11 12 ч.
Бороться со своими дипфейками на YouTube теперь может любой желающий 12 ч.
ZA/UM показала 12 минут геймплея Zero Parades: For Dead Spies — психоделической шпионской RPG в духе Disco Elysium 15 ч.
Новая статья: Mixtape — воспоминания никто не отнимет. Рецензия 16-05 00:02
Google начнёт наказывать сайты за накрутку попаданий в ИИ-ответы 15-05 23:44
Спринт, торговля и продолжение сюжета: разработчики Subnautica 2 раскрыли план улучшения игры на ближайшие месяцы 15-05 19:59
ChatGPT получит прямой доступ к банковским счетам пользователей — для анализа расходов и финансовых советов 15-05 19:42
Трамп и Си Цзиньпин обсудили ограничения слишком умного ИИ и зависшие поставки Nvidia H200 15-05 19:18