Сегодня 23 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила GPT-5.5 — свою самую умную LLM, которая сама доводит задачи до конца

OpenAI анонсировала GPT-5.5 — ИИ-модель, которую компания называет самой умной и интуитивной на сегодняшний день. В новинке упор сделан не столько на рост отдельных метрик, сколько на переход к более автономной работе: модель быстрее понимает, чего от неё хотят, и способна сама довести задачу до результата, даже если она изначально сформулирована расплывчато и состоит из нескольких частей.

 Источник изображений: OpenAI

Источник изображений: OpenAI

Главная идея GPT-5.5 — снять с пользователя необходимость детально управлять каждым шагом на пути к цели. Если раньше приходилось поэтапно направлять модель, то теперь ей можно дать сложную задачу целиком, и она сама разберётся, как к ней подступиться. Модель умеет выстраивать план действий, подключать нужные инструменты, проверять промежуточные результаты и корректировать курс, если что-то идёт не так. Это особенно заметно в задачах, выходящих за рамки простой генерации текста: от программирования и анализа данных до работы с документами, таблицами и интерфейсами программ.

Сильнее всего прогресс проявился в программировании. GPT-5.5 лучше удерживает контекст крупных проектов, глубже понимает архитектуру систем и способна решать задачи, требующие длительного рассуждения. В тестах она демонстрирует заметный прирост по сравнению с GPT-5.4, в том числе в сложных сценариях работы через командную строку и при решении инженерных задач, на выполнение которых у человека уходит в среднем около 20 часов. При этом разработчики отмечают не рост «баллов» в тестах, а качественное изменение поведения: модель лучше понимает, почему система ломается, где именно нужно вносить правки и какие последствия это повлечёт для остального кода.

Новый уровень автономности проявляется и в повседневной работе. В связке с инструментами вроде Codex модель начинает вести себя как полноценный цифровой помощник, способный видеть интерфейс, кликать, вводить текст, перемещаться между инструментами, собирать информацию из разных источников и превращать её в готовые документы, отчёты или таблицы, заверяет OpenAI. В самой OpenAI такие сценарии уже применяются на практике: GPT-5.5 используют для анализа больших массивов данных, автоматизации отчётности и ускорения внутренних процессов на часы, а то и недели.

 В бенчмарках GPT-5.5 показывает себя отлично

В бенчмарках GPT-5.5 показывает себя отлично

Отдельно были усилены научные и аналитические возможности. Модель лучше справляется с задачами, где требуется не просто ответ, а последовательная работа с гипотезами и данными. Она может проходить весь цикл — от изучения исходной информации до интерпретации результатов и предложения следующих шагов. В ряде тестов, связанных с биоинформатикой и математикой, GPT-5.5 показывает заметный прогресс, а в одном из экспериментов модель помогла получить новое математическое доказательство, что разработчики рассматривают как признак выхода на уровень «соисследователя», а не просто инструмента.

При этом рост возможностей не привёл к потере скорости. GPT-5.5 работает с задержками на уровне предыдущего поколения, но при этом выполняет задачи эффективнее и тратит меньше токенов. В задачах программирования — вплоть до двукратного снижения стоимости по сравнению с сопоставимыми моделями конкурентов. Иными словами, развитие идёт не только в сторону качества, но и в сторону практической эффективности.

С усилением возможностей ужесточились и меры безопасности. Модель прошла расширенное тестирование, включая сценарии, связанные с кибербезопасностью, а также получила более строгие механизмы контроля потенциально опасных запросов. При этом OpenAI подчёркивает, что стремится сохранить баланс между защитой от злоупотреблений и доступностью для полезных задач, особенно в сфере киберзащиты инфраструктуры.

GPT-5.5 уже начала постепенно появляться у пользователей. Она доступна в ChatGPT для платных подписчиков Plus, Pro, Business и Enterprise, а также используется в Codex с расширенным контекстом. Для планов Pro, Business и Enterprise доступна также более продвинутая версия GPT-5.5 Pro, которая ориентирована на сложные задачи, где важны точность и глубина анализа. Доступ к новинкам через API обещают добавить позднее.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Глава WhatsApp покинет свой пост — его сменит основатель индийского финтех-стартапа Шах 2 ч.
«Лорд-капитаны, мы услышали ваше мнение»: Owlcat Games убрала лаунчер из Warhammer 40,000: Rogue Trader спустя день после запуска 2 ч.
Мобильный Firefox научился составлять сводки страниц, если встряхнуть смартфон 2 ч.
Звезда God of War Laufey знала об игре с 2018 года — Santa Monica запланировала приключения жены Кратоса почти десять лет назад 3 ч.
Во втором трейлере GTA VI спустя больше года нашли отсылку к Томми Версетти из GTA: Vice City 3 ч.
Cloudflare и крупнейшие разработчики браузеров научат сайты отличать людей от ботов 4 ч.
Анонсирован Give Us A Sign — кооперативный хоррор про поиск призраков на чересчур «живых» локациях 5 ч.
OpenAI запустила инициативу Patch the Planet, чтобы помочь разработчикам открытого ПО в поиске ошибок 5 ч.
Блогер показал 25 минут геймплея мультиплеерного мода для The Last of Us Part II — игроки в восторге 6 ч.
«Такого никто никогда не видел»: загадочный хоррор OD будет «максимально страшным», но Кодзима придумал особую систему для пугливых игроков 6 ч.
Технологический суверенитет ЕС дорого обойдётся потребителям, предупредили европейские автопроизводители 49 мин.
Китай снова на вершине TOP500: суперкомпьютер LineShine без чипов Nvidia, Intel и AMD стал самым мощным в мире 51 мин.
В Китае создали керамический литиевый аккумулятор, способный работать в кипятке — для носимой электроники и космоса 58 мин.
Steam Machine будет поставляться с одним модулем DDR5 на 16 Гбайт или двумя по 8 Гбайт 2 ч.
Samsung уже выручила на поставках HBM4 более $1 млрд, а SK hynix начала сдерживать расширение поставок 3 ч.
Samsung показала первую смартфонную память UFS 5.0 — как не самые быстрые SSD с PCIe 5.0 3 ч.
Автономный грузовик «Яндекса» впервые совершил поездку на 700 км — не без подстраховки 3 ч.
От секретного китайского многоразового космоплана на орбите отделился загадочный объект 3 ч.
Роботы рано или поздно заменят до 700 000 курьеров китайской JD.com, заявил глава компании 3 ч.
Акции Alphabet пережили худший день более чем за год — компания разом подешевела на 5 % 3 ч.