Сегодня 31 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI облажалась с диаграммами на презентации GPT-5 — Альтман признал ошибку

Во время масштабной прямой трансляции с презентацией модели искусственного интеллекта GPT-5 компания OpenAI продемонстрировала несколько диаграмм, которые должны были иллюстрировать впечатляющие способности новой модели. Однако при более внимательном рассмотрении некоторые графики оказались построены с серьёзными неточностями.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

На одной из диаграмм, которая, по иронии, должна была демонстрировать высокие результаты GPT-5 в «оценке склонности к обману у разных моделей», шкала не соответствует числовым значениям. Например, для «обмана при написании кода» у GPT-5 указано значение 50,0 %, тогда как у модели o3 — 47,4 %. Однако столбец для o3 на диаграмме оказался выше. Более того, в корпоративном блоге OpenAI указано совсем другое значение для GPT-5 — 16,5 %, что, вероятно, и является верным показателем.

 Источник изображения: x.com/shreyk0

Источник изображения: x.com/shreyk0

В тесте SWE-bench Verified один из показателей GPT-5 должен быть ниже, чем у o3, но ему соответствует более высокий столбец диаграммы; на этой же диаграмме результаты o3 и GPT-4o различаются, но иллюстрируются столбцами одинакового размера. В OpenAI восприняли ошибку всерьёз — гендиректор компании Сэм Альтман (Sam Altman) повинился и добавил, что в корпоративном блоге опубликованы правильные версии.

 Источник изображения: x.com/EgeErdil2

Источник изображения: x.com/EgeErdil2

В OpenAI не уточнили, использовалась ли сама GPT-5 для построения диаграмм, но такой инцидент явно не добавляет доверия в контексте масштабной презентации новой модели. Особенно с учётом того, что разработчики заявили о значительном снижении уровня галлюцинаций у GPT-5.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Meta может начать использовать ИИ-модели Google и OpenAI в своих приложениях 2 ч.
Белый дом приказал вернуть ИИ-бота xAI Grok «как можно скорее» 4 ч.
Команда специалистов Meta по ИИ, на которую Цукерберг потратил миллиарды долларов, уже трещит по швам 5 ч.
Новая статья: Is This Seat Taken? — все когда-нибудь сядут. Рецензия 12 ч.
Meta без спроса заполонила свои соцсети ИИ-двойниками Тейлор Свифт, Скарлетт Йоханссон и других знаменитостей 18 ч.
Стартап Илона Маска обвинил бывшего сотрудника в краже секретов для OpenAI 22 ч.
xAI Илона Маска представила ИИ для программирования, который отвечает мгновенно 22 ч.
Тестирование крупного обновления Windows 11 25H2 вышло на финишный этап 30-08 11:45
ЕС всё же оштрафует Google за антиконкурентное поведение, но наказание будет скромным 30-08 10:43
Meta исправила методику обучения ИИ после скандала с неуместными разговорами с подростками 30-08 10:23
Samsung анонсировала 37-дюймовый монитор ViewFinity S8 с поддержкой 4K, USB Type-C на 90 Вт и встроенным KVM-переключателем 30 мин.
SK hynix серьёзно приблизилась к Samsung по величине выручки на рынке NAND во втором квартале 3 ч.
Samsung готова усилить собственные разработки ИИ-моделями с открытым исходным кодом 4 ч.
Samsung добавила ИИ-помощника Microsoft Copilot в свои новые телевизоры 4 ч.
Доля электромобилей на рынке Китая достигла 31 %, а с учётом гибридов перевалила за 50 % 4 ч.
В блистающих останках умирающей звезды «Джеймс Уэбб» увидел, как могла зарождаться Земля 15 ч.
Nvidia захватила почти четверть рынка GPU для ПК — лидирует Intel, а доля AMD сжалась до 14 % 20 ч.
Realme не будет выпускать складные смартфоны, а сделает ставку на флагманы и пауэрбанки 24 ч.
Китайские учёные создали «всечастотный» чип для 6G — 100 Гбит/с почти в любых условиях 24 ч.
Intel избавилась от части обязательств перед США по «Закону о чипах» 30-08 07:53