Сегодня 03 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила GPT-5.5 — свою самую умную LLM, которая сама доводит задачи до конца

OpenAI анонсировала GPT-5.5 — ИИ-модель, которую компания называет самой умной и интуитивной на сегодняшний день. В новинке упор сделан не столько на рост отдельных метрик, сколько на переход к более автономной работе: модель быстрее понимает, чего от неё хотят, и способна сама довести задачу до результата, даже если она изначально сформулирована расплывчато и состоит из нескольких частей.

 Источник изображений: OpenAI

Источник изображений: OpenAI

Главная идея GPT-5.5 — снять с пользователя необходимость детально управлять каждым шагом на пути к цели. Если раньше приходилось поэтапно направлять модель, то теперь ей можно дать сложную задачу целиком, и она сама разберётся, как к ней подступиться. Модель умеет выстраивать план действий, подключать нужные инструменты, проверять промежуточные результаты и корректировать курс, если что-то идёт не так. Это особенно заметно в задачах, выходящих за рамки простой генерации текста: от программирования и анализа данных до работы с документами, таблицами и интерфейсами программ.

Сильнее всего прогресс проявился в программировании. GPT-5.5 лучше удерживает контекст крупных проектов, глубже понимает архитектуру систем и способна решать задачи, требующие длительного рассуждения. В тестах она демонстрирует заметный прирост по сравнению с GPT-5.4, в том числе в сложных сценариях работы через командную строку и при решении инженерных задач, на выполнение которых у человека уходит в среднем около 20 часов. При этом разработчики отмечают не рост «баллов» в тестах, а качественное изменение поведения: модель лучше понимает, почему система ломается, где именно нужно вносить правки и какие последствия это повлечёт для остального кода.

Новый уровень автономности проявляется и в повседневной работе. В связке с инструментами вроде Codex модель начинает вести себя как полноценный цифровой помощник, способный видеть интерфейс, кликать, вводить текст, перемещаться между инструментами, собирать информацию из разных источников и превращать её в готовые документы, отчёты или таблицы, заверяет OpenAI. В самой OpenAI такие сценарии уже применяются на практике: GPT-5.5 используют для анализа больших массивов данных, автоматизации отчётности и ускорения внутренних процессов на часы, а то и недели.

 В бенчмарках GPT-5.5 показывает себя отлично

В бенчмарках GPT-5.5 показывает себя отлично

Отдельно были усилены научные и аналитические возможности. Модель лучше справляется с задачами, где требуется не просто ответ, а последовательная работа с гипотезами и данными. Она может проходить весь цикл — от изучения исходной информации до интерпретации результатов и предложения следующих шагов. В ряде тестов, связанных с биоинформатикой и математикой, GPT-5.5 показывает заметный прогресс, а в одном из экспериментов модель помогла получить новое математическое доказательство, что разработчики рассматривают как признак выхода на уровень «соисследователя», а не просто инструмента.

При этом рост возможностей не привёл к потере скорости. GPT-5.5 работает с задержками на уровне предыдущего поколения, но при этом выполняет задачи эффективнее и тратит меньше токенов. В задачах программирования — вплоть до двукратного снижения стоимости по сравнению с сопоставимыми моделями конкурентов. Иными словами, развитие идёт не только в сторону качества, но и в сторону практической эффективности.

С усилением возможностей ужесточились и меры безопасности. Модель прошла расширенное тестирование, включая сценарии, связанные с кибербезопасностью, а также получила более строгие механизмы контроля потенциально опасных запросов. При этом OpenAI подчёркивает, что стремится сохранить баланс между защитой от злоупотреблений и доступностью для полезных задач, особенно в сфере киберзащиты инфраструктуры.

GPT-5.5 уже начала постепенно появляться у пользователей. Она доступна в ChatGPT для платных подписчиков Plus, Pro, Business и Enterprise, а также используется в Codex с расширенным контекстом. Для планов Pro, Business и Enterprise доступна также более продвинутая версия GPT-5.5 Pro, которая ориентирована на сложные задачи, где важны точность и глубина анализа. Доступ к новинкам через API обещают добавить позднее.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Stuntman: Hollywood отправит игроков исполнять легендарные трюки из «Назад в будущее», «Форсажа», «Рыцаря дорог» и других хитов кинематографа 45 мин.
Anthropic доверит свой самый опасный ИИ Mythos 150 организациям в 15 странах по всему миру 48 мин.
Тест 3DMark для трассировки лучей получил поддержку нативного 4K, ИИ-масштабирования и генерации кадров 2 ч.
Google позволит исключать сайты из ИИ-поиска без потери позиций в выдаче 2 ч.
Microsoft представила Project Solara — ОС на Android для ИИ-агентов, а не людей 2 ч.
«Отвратительно в лучшем смысле этого слова»: сюжетный трейлер гротескного хоррора Ill поразил игроков уровнем жестокости 2 ч.
Курс биткоина снова рухнул ниже $70 000 — сейчас криптовалюта торгуется в районе $67 тысяч 2 ч.
ChatGPT набрал миллиард активных пользователей — на это ушло рекордно мало времени 2 ч.
В погоне за совершенством: китайский ролевой экшен Phantom Blade Zero не выйдет 9 сентября, но долго ждать не придётся 3 ч.
Амбициозный паранормальный боевик Control Resonant получил дату выхода — в России игру ни купить, ни запустить 4 ч.
Репортаж со стенда MSI на Computex 2026: мониторы и настольные ПК для геймеров — теперь с ИИ 34 мин.
Власти Вирджинии отклонили проект мега-кампуса ЦОД компании Tract под давлением общественности 2 ч.
Oracle и OpenAI начали строительство кампуса The Barn в рамках проекта Stargate в Мичигане 2 ч.
Dell представила серверы PowerEdge на базе NVIDIA Vera для агентного ИИ 2 ч.
Бум ИИ разогнал выручку от продаж NAND в 3,5 раза — до рекордных $46 млрд за первый квартал 2 ч.
Microsoft анонсировала квантовый процессор Majorana 2, который позволит проводить вычисления в 1000 раз надёжнее, чем раньше 4 ч.
Репортаж со стенда MSI на Computex 2026: OLED-мониторы для профессионалов, экосистема PRO MAX и локальный ИИ 4 ч.
Китай без предупреждения запустил ракету «Чанчжэн-12B» — свой аналог Falcon 9 4 ч.
Гибкие сетевые настройки и информационная безопасность: обновление Basis SDN 4 ч.
Гибкие сетевые настройки и информационная безопасность: обновление Basis SDN 4 ч.