Сегодня 03 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → sonnet

Меньше галлюцинаций и миллионный контекст: Anthropic представила Sonnet 4.6 и она уже доступна бесплатно в Claude

Anthropic обновила свою большую языковую модель Sonnet среднего уровня. В анонсе Sonnet 4.6 разработчики Anthropic подчеркнули улучшения в генерации программного кода, рассуждениях с длинным контекстом, выполнении инструкций и работе с компьютером. Новинка станет стандартной моделью для чат-бота Claude как для бесплатных пользователей, так и в платной подписке Pro.

 Источник изображений: Anthropic

Источник изображений: Anthropic

Sonnet 4.6 предлагает контекстное окно размером 1 миллион токенов, что вдвое больше, чем было у предыдущей версии Sonnet. Anthropic описала новое контекстное окно как «достаточное для хранения целых кодовых баз, длинных контрактов или десятков исследовательских работ в одном запросе». В компании подчёркивают, что модель не только удерживает большой объём информации, но и эффективно работает с ним при построении логических цепочек.

По данным Anthropic, разработчики, тестировавшие Sonnet 4.6 в раннем доступе, в 70 % случаев предпочли её версии 4.5. Пользователи отмечали более аккуратную работу с контекстом кода, меньшее количество дублирования логики и более последовательное выполнение инструкций. Разработчики также сообщают о снижении числа «галлюцинаций» и ложных заявлений об успешном выполнении задачи.

Отдельное внимание уделено работе с компьютером без специализированных API. Модель взаимодействует с программами так же, как человек — через виртуальные клики мышью и ввод с клавиатуры. В бенчмарке OSWorld, который имитирует задачи в Chrome, LibreOffice и VS Code, свежая Sonnet 4.6 демонстрирует заметный прогресс по сравнению с предыдущими версиями. По словам представителей компании, в ряде сценариев — например, при работе со сложными таблицами или многошаговыми веб-формами — модель приближается к уровню человека. При этом Anthropic признаёт, что ИИ по-прежнему уступает наиболее опытным пользователям и что реальная работа с ПО сложнее лабораторных тестов.

Anthropic отмечает, что Sonnet 4.6 предоставляет значительно улучшенные навыки программирования по сравнению с предыдущей версией. В соответствующих бенчмарках новинка оказалась лучше Gemini 3 Pro, а также почти сравнялась с Opus 4.5. По словам бета-тестеров модели, особенно заметны улучшения в задачах фронтенд-разработки и финансового анализа. Также отмечается, что Sonnet 4.6 в ряде задач смогла обеспечить уровень производительности, для достижения которого прежде требовалось использовать модели класса Opus, в том числе в реальных офисных задачах.

Anthropic также раскрыла показатели на тесте ARC-AGI-2 — одном из наиболее сложных бенчмарков, оценивающих способность модели к абстрактному рассуждению и обобщению (навыков, характерных для человеческого интеллекта). Sonnet 4.6 достигла 60,4 % при высоком уровне «усилия мышления». Этот результат ставит Sonnet 4.6 выше большинства сопоставимых моделей, хотя он отстаёт от таких решений, как Opus 4.6, Gemini 3 Deep Think и одной из усовершенствованных версий GPT 5.2.

В конце отметим, что релиз Sonnet 4.6 состоялся всего через две недели после запуска Opus 4.6, а значит, обновлённая модель Haiku, вероятно, появится в ближайшие недели. Модель уже доступна в боте Claude и приложении, а также через API для сторонних сервисов. Стоимость в последнем случае остаётся на уровне Sonnet 4.5 — от $3 за миллион входных токенов и $15 за миллион выходных.


window-new
Soft
Hard
Тренды 🔥
Креативный директор Naughty Dog заинтриговал фанатов фотографией из командировки — на снимке углядели тизер Uncharted 5 15 мин.
Комедийная ретрофутуристическая игра Breathedge 2 пережила тотальную переработку геймплея и взяла курс на ранний доступ Steam 2 ч.
State of Decay 3 восстала из мёртвых и спустя шесть лет после анонса готовится к публичной «альфе» 3 ч.
ИИ-модель Claude обнаружила уязвимость и разработала рабочий эксплойт для FreeBSD 4 ч.
Китайские власти ополчились на цифровых людей 4 ч.
Google, Meta и другие бигтехи больше не смогут избегать ответственности за контент пользователей, как делали 30 лет 4 ч.
Фэнтезийная ролевая игра Songs of Glimmerwick отправит в мир, где магия рождается из музыки — новый трейлер, релиз в 2026 году и демо на подходе 4 ч.
Microsoft признала, что Copilot — для развлечений, а не профессиональных задач 4 ч.
Издатель GTA VI неожиданно уволил главу ИИ-отдела и его команду 5 ч.
Ubuntu Linux теперь требует 6 Гбайт оперативной памяти — на 50 % больше, чем Windows 11 5 ч.
Самолёт без рулей X-65 от дочки Boeing стал на шаг ближе к полёту — он будет управляться струями воздуха 58 мин.
На память теперь уходит до 30 % расходов при создании ЦОД — в четыре раза больше, чем в 2023 году 2 ч.
MSI выпустила беспроводной PCIe-адаптер Herald BE9400 с поддержкой Wi-Fi 7 и Bluetooth 5.4 2 ч.
В России представили антропоморфного робота-курьера «Аркус» 4 ч.
Intel прикупит ещё чуть-чуть SambaNova 4 ч.
Японский энтузиаст исхитрился подключить M.2 SSD к консоли Switch 2 через слот microSD Express 4 ч.
Asus сэкономила на упаковке, из-за чего OLED-мониторы за $1299 приходят покупателям треснувшими 4 ч.
США хотят полностью запретить ввоз всей продукции Huawei и ряда других китайских компаний 4 ч.
Суд снял обвинения с сооснователя Supermicro по делу о контрабанде чипов Nvidia в Китай 4 ч.
TSMC задумала расширение производства в США до 12 фабрик, четвёрки предприятий по упаковке чипов и центра R&D 4 ч.