Сегодня 01 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic выпустила Claude Sonnet 5 — ИИ-модель «в среднем весе», которая приближается по уровню к Opus 4.8 и заточена под работу с агентами

Одной из важнейших возможностей для современных моделей искусственного интеллекта является их способность управлять агентскими приложениями, и при разработке новой Claude Sonnet 5 компания Anthropic уделила этому первостепенное внимание.

 Источник изображений: anthropic.com

Источник изображений: anthropic.com

«Она умеет планировать, пользоваться такими средствами как браузеры и терминал, а также работать автономно на уровне, который ещё несколько месяцев назад предполагали более крупные и дорогие модели», — рассказали в компании. Концепция Sonnet 5 основана на том, что управление ИИ-агентами является новым базовым требованием, которое предъявляется к моделям в любом сегменте. Решающим фактором является не то, какая из них лучше всего справляется с этой задачей, а то, насколько дёшево и надёжно она способна делать это без участия человека.

Относящаяся к средней категории Claude Sonnet 5 обещает качество работы, близкое к Opus 4.8, но значительно дешевле; новая модель с сегодняшнего дня устанавливается по умолчанию для всех пользователей платформы Claude — тех, кто на бесплатном тарифе, и тех, кто оформил подписку. При доступе по API до 31 августа цена подключения к Sonnet 5 составляет $2 за 1 млн входных и $10 за 1 млн выходных токенов; далее цены вырастут до $3 и $15 соответственно. Новая модель демонстрирует значительные улучшения по сравнению с вышедшей в феврале Sonnet 4.6. В одном из тестов на написание кода Sonnet 5 набрала 63,2 % — Opus 4.8 показала 69,2 %, а Sonnet 4.6 — 58,1 %. В тесте на обработку данных Sonnet 5 даже немного обошла Opus 4.8, известную своей способностью решать самые сложные задачи, принимать сложные решения и проводить глубокие исследования.

«Opus 4.8 всё ещё остаётся предпочтительной моделью для более высокой точности в таких задачах, но Sonnet 5 даёт разработчикам менее дорогие варианты с более высоким качеством, чем доступные ранее. С Sonnet 5 и Opus 4.8 пользователи могут выбирать уровень сложности, чтобы найти идеальный баланс между стоимостью и производительностью», — пояснил разработчик. У Sonnet 5 также снизился уровень «нежелательного поведения», то есть она менее подвержена злоупотреблениям и более безопасна в агентских контекстах, отклоняя вредоносные запросы и обходя попытки взлома при атаках с внедрением запросов. По сравнению с Sonnet 4.6 она реже демонстрирует галлюцинации и подобострастие.

Конечно, ИИ-модель среднего класса Sonnet 5 всё-таки уступает Opus 4.8 и Claude Mythos Preview. «Оценки также показывают, что она обладает гораздо меньшей способностью выполнять опасные задачи в области кибербезопасности, чем наши текущие модели Opus», — предупредили в Anthropic.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Against the Storm 2 подождёт: анонсирован симулятор выживания во вселенной Against the Storm 26 мин.
Anthropic выпустила Claude Sonnet 5 — ИИ-модель «в среднем весе», которая приближается по уровню к Opus 4.8 и заточена под работу с агентами 32 мин.
Новая ИИ-модель Anthropic Claude Science поможет учёным эффективнее бороться с болезнями и создавать лекарства 2 ч.
Anthropic договорилась с США — запрет на ИИ-модель Fable 5 снят 6 ч.
Microsoft выпустила публичное превью WSL Containers для запуска контейнеров Linux в Windows 10 ч.
Уязвимость BlueHammer в Windows Defender не потеряла актуальность, несмотря на апрельский патч 11 ч.
Журналисты раскрыли масштаб будущих увольнений в Xbox — под угрозой закрытия оказалась даже Arkane Studios и её Marvel’s Blade 12 ч.
ИИ научили говорить как пещерный человек — чтобы экономить миллионы на токенах 13 ч.
Meta не сумела отделаться от иска о детской зависимости от соцсетей — суд состоится 18 августа 15 ч.
Улыбаемся и машем: Quantic Dream отвергла опасения работников о судьбе Star Wars Eclipse 15 ч.
Xiaomi, Oppo и Vivo резко урезают планы по поставкам смартфонов на 2026 год 21 мин.
Blue Origin перестроит взорванную стартовую площадку под более мощную New Glenn 28 мин.
Инвесторы за июнь совершили разворот и уронили капитализацию «большой семерки» бигтехов на $2,3 трлн 33 мин.
Смартфон Huawei nova Y74 с батареей на 6620 мА·ч вышел в России по цене от 15 990 рублей 49 мин.
Глава Micron обвинил в нынешнем дефиците памяти низкие цены прошлых лет 3 ч.
Планы южнокорейских производителей памяти по расширению мощностей вызвали рост курса акций поставщиков оборудования 3 ч.
Представлен электрический кроссовер BMW iX5 с запасом хода в 845 км 4 ч.
Новая статья: Ryzen и двухранговая DDR5: проверяем комплект G.Skill Trident Z5 Royal DDR5-6400 CL32 64GB 10 ч.
Южная Корея инвестирует почти $3 трлн в полупроводники и ИИ 11 ч.
Titan Army показала безочковый 3D-монитор M27E6V-3D с 4K, 190 Гц и очень высокой яркостью для геймеров 13 ч.