Сегодня 02 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic выпустила Claude Sonnet 5 — ИИ-модель «в среднем весе», которая приближается по уровню к Opus 4.8 и заточена под работу с агентами

Одной из важнейших возможностей для современных моделей искусственного интеллекта является их способность управлять агентскими приложениями, и при разработке новой Claude Sonnet 5 компания Anthropic уделила этому первостепенное внимание.

 Источник изображений: anthropic.com

Источник изображений: anthropic.com

«Она умеет планировать, пользоваться такими средствами как браузеры и терминал, а также работать автономно на уровне, который ещё несколько месяцев назад предполагали более крупные и дорогие модели», — рассказали в компании. Концепция Sonnet 5 основана на том, что управление ИИ-агентами является новым базовым требованием, которое предъявляется к моделям в любом сегменте. Решающим фактором является не то, какая из них лучше всего справляется с этой задачей, а то, насколько дёшево и надёжно она способна делать это без участия человека.

Относящаяся к средней категории Claude Sonnet 5 обещает качество работы, близкое к Opus 4.8, но значительно дешевле; новая модель с сегодняшнего дня устанавливается по умолчанию для всех пользователей платформы Claude — тех, кто на бесплатном тарифе, и тех, кто оформил подписку. При доступе по API до 31 августа цена подключения к Sonnet 5 составляет $2 за 1 млн входных и $10 за 1 млн выходных токенов; далее цены вырастут до $3 и $15 соответственно. Новая модель демонстрирует значительные улучшения по сравнению с вышедшей в феврале Sonnet 4.6. В одном из тестов на написание кода Sonnet 5 набрала 63,2 % — Opus 4.8 показала 69,2 %, а Sonnet 4.6 — 58,1 %. В тесте на обработку данных Sonnet 5 даже немного обошла Opus 4.8, известную своей способностью решать самые сложные задачи, принимать сложные решения и проводить глубокие исследования.

«Opus 4.8 всё ещё остаётся предпочтительной моделью для более высокой точности в таких задачах, но Sonnet 5 даёт разработчикам менее дорогие варианты с более высоким качеством, чем доступные ранее. С Sonnet 5 и Opus 4.8 пользователи могут выбирать уровень сложности, чтобы найти идеальный баланс между стоимостью и производительностью», — пояснил разработчик. У Sonnet 5 также снизился уровень «нежелательного поведения», то есть она менее подвержена злоупотреблениям и более безопасна в агентских контекстах, отклоняя вредоносные запросы и обходя попытки взлома при атаках с внедрением запросов. По сравнению с Sonnet 4.6 она реже демонстрирует галлюцинации и подобострастие.

Конечно, ИИ-модель среднего класса Sonnet 5 всё-таки уступает Opus 4.8 и Claude Mythos Preview. «Оценки также показывают, что она обладает гораздо меньшей способностью выполнять опасные задачи в области кибербезопасности, чем наши текущие модели Opus», — предупредили в Anthropic.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ФАС пригрозила Apple штрафом в 4 млрд рублей за дискриминацию российских поисковиков 12 ч.
Вышел Chrome 150 — в нём исправили почти 400 уязвимостей, включая 15 критических 12 ч.
«Это больше похоже на шутку»: Sony разочаровала подписчиков анонсом июльской подборки игр PS Plus 12 ч.
Разработчики Subnautica 2 всё-таки получат от Krafton заслуженные денежные бонусы, а старый новый гендиректор опять покидает студию 13 ч.
Samsung закроет свой мессенджер в пользу аналога Google в этом месяце 14 ч.
Издатель Warhammer 40,000: Battlesector спас Warhammer Blood Bowl от неплатёжеспособной Nacon 14 ч.
Австрия призвала Евросоюз привлечь Anthropic на свою территорию после введённых США ограничений на передовые ИИ-модели 14 ч.
«Дело было не в деньгах»: бывший босс PlayStation объяснил, зачем Sony начала выпускать свои эксклюзивы на ПК 15 ч.
Google радикально усложнила разблокировку смартфонов на Android 17 16 ч.
Sony полностью прекратит выпускать диски с играми для PlayStation с января 2028 года 17 ч.
В следующем году Apple обновит линейку планшетов iPad Pro и представит новый MacBook Pro начального уровня 2 ч.
Илону Маску пришлось в очередной раз опровергать наличие у него намерений выпустить смартфон 4 ч.
На Тайване арестовали трёх человек в рамках расследования контрабанды ИИ-серверов Supermicro в Китай 8 ч.
Новая статья: Обзор блока питания Chieftec Stealth (SPX-1000-FC) 9 ч.
Microsoft научит Xbox превращать диски с играми в цифровые лицензии 9 ч.
GeForce RTX 5090D стала первой видеокартой Blackwell, чей GPU покорил 4 ГГц 12 ч.
В Тайване арестованы сотрудники Supermicro по делу о контрабанде чипов Nvidia в Китай 14 ч.
Meta задумала стать облачным провайдером и продавать доступ к своим ИИ-суперкомпьютерам, как AWS и Google Cloud 14 ч.
Acer представила 27-дюймовый геймерский монитор Nitro XV273U F5 с разгоном до 1000 Гц за $700 14 ч.
Сайты OnePlus стали рекламировать смартфоны Oppo вместо своих новинок 15 ч.