Сегодня 12 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Президент OpenAI опубликовал изображение, созданное GPT-4o — оно очень впечатляет

На этой неделе OpenAI представила модель искусственного интеллекта нового поколения GPT-4o. Буква «o» в её названии означает Omni, подразумевая, что она изначально поддерживает несколько форматов ввода — ранее мультимодальность предполагала преобразование всех нетекстовых форматов в текст. Президент и соучредитель OpenAI Грег Брокман (Greg Brockman) впервые опубликовал созданное GPT-4o изображение.

 Источник изображения: twitter.com/gdb

То самое сгенерированное GPT-4o изображение. Источник изображения: twitter.com/gdb

Поддержка текста, изображений и звука в качестве входных данных означает, что модель также способна их генерировать. Приведённая выше картинка — не фотография, а творение GPT-4o. На ней изображён мужчина в футболке с логотипом OpenAI, который пишет на доске. Сверху находится частично стёртая надпись «Перенос между модальностями». Далее следует текст: «Положим, мы напрямую моделируем P (текст, пиксели, звук) посредством одного авторегрессионного трансформера. Каковы за и против?».

Если присмотреться, можно разглядеть некоторые признаки того, что изображение было создано ИИ. Доска висит под неестественным углом, под ней непонятным образом находится ещё одна, рука мужчины имеет странную форму, а освещение неоднородно. Невероятной, вместе с тем, кажется способность ИИ генерировать длинные фрагменты связного текста — с этим с трудом справляется даже DALL-E 3. Генератор изображений GPT-4o широкой публике пока недоступен: пользователи ChatGPT с подключённой моделью нового поколения пока могут генерировать изображения лишь с DALL-E 3. Но президент OpenAI Грег Брокман уверяет, что компания прилагает значительные усилия, чтобы открыть к модели нового поколения полный доступ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Несмотря на 10 месяцев молчания, мультиплеерный боевик The Duskbloods от создателей Bloodborne и Elden Ring всё ещё запланирован на 2026 год 39 мин.
«Те же щи, да пожиже»: 19 минут геймплея шпионской ролевой игры Zero Parades: For Dead Spies в духе Disco Elysium не впечатлили фанатов 3 ч.
Амбициозный симулятор выживания Blackfrost: The Long Dark 2 не выйдет в 2026 году — разработчики несут потери 3 ч.
Google научит Chrome запускаться вместе с Windows — сразу с открытым окном 4 ч.
Илон Маск сообщил о скором запуске X Money — сервиса, «где будут храниться все деньги» пользователей X 4 ч.
Сайт-двойник 7-Zip десять дней заражал пользователей — вредонос подменял ссылки с задержкой 4 ч.
В Steam вышла демоверсия «Былины» — грандиозной экшен-RPG в мире славянских мифов 5 ч.
Владелец TikTok выпустил ИИ-модель Seedance 2.0 для генерации видео — она стала вирусной 5 ч.
Mewgenics за полтора дня стала самой быстро продаваемой игрой от создателя The Binding of Isaac и Super Meat Boy 5 ч.
Илон Маск объяснил массовый исход основателей xAI 6 ч.
Обещанного два года ждут: Google наконец выпустила приложение YouTube для Apple Vision Pro 2 ч.
Триумф AMD: Ryzen захватили больше 36 % рынка CPU для настольных ПК, пока Intel теряет позиции по всем направлениям 2 ч.
Европа только что запустила свою самую мощную ракету — Ariane 64 в максимальной конфигурации 2 ч.
Кризис памяти разогнал продажи ПК — бизнес закупается, пока не стало ещё дороже 4 ч.
InWin представила панорамный компьютерный корпус W50 с геометрическим дизайном 4 ч.
Заказы на газовые турбины Siemens бьют рекорды — причина кроется в ненасытности ИИ 4 ч.
Samsung представила пятислойные матрицы QD-OLED Penta Tandem — вдвое долговечнее и с яркостью до 4500 кд/м² 5 ч.
США выписали Applied Materials штраф в $252 млн за продажу санкционного оборудования китайской SMIC 5 ч.
Для самых ленивых: выпущен робот для складывания белья после стирки за $7999 5 ч.
MSI оценила GeForce RTX 5090 Lightning Z в $5090 — всего выйдет 1300 видеокарт, а право покупки разыграют в лотерее 5 ч.