Сегодня 10 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Инженеры проиграли ИИ: модель Claude Opus 4.5 справилась с заданием Anthropic лучше любого из людей

Anthropic вчера объявила о выпуске новой флагманской модели искусственного интеллекта Claude Opus 4.5. Позже компания рассказала, что в двухчасовом задании, предлагаемом самой Anthropic при найме сотрудников на инженерные позиции, Opus 4.5 показала лучший результат по сравнению с живыми участниками теста.

 Источник изображения: AI

Источник изображения: AI

По утверждению Anthropic, результат ИИ достигнут за счёт многократного решения каждой задачи и выбора лучшего из полученных ответов. Хотя тест не охватывает все компетенции, необходимые инженеру, сам факт превосходства модели над сильными кандидатами в ключевых технических аспектах заставляет предположить, что ИИ в будущем может изменить инженерию как профессию, пишет Business Insider.

Подробности содержания теста не раскрываются, но из отзывов на платформе Glassdoor известно лишь, что в 2024 году он включал четыре уровня и требовал реализации определённой системы с последующим добавлением функциональности. Неизвестно, был ли использован аналогичный формат задания при оценке новой версии Claude Opus 4.5, которая вышла спустя всего три месяца после предыдущей модели, получив улучшения не только в генерации кода, но и в создании профессиональных документов, включая таблицы Excel и презентации PowerPoint.

Данный релиз, по мнению специалистов, продолжает укреплять лидирующие позиции Anthropic в сфере ИИ для программирования. Даже компания Meta Марка Цукерберга (Mark Zuckerberg), являющаяся конкурентом в гонке ИИ, использует Claude для поддержки своего внутреннего помощника по кодированию под названием Devmate.

Методы обучения своих моделей компания держит в секрете. Однако ранее Эрик Саймонс (Eric Simons), генеральный директор стартапа Stackblitz, разработавшего сервис Bolt.new, предположил, что Anthropic, возможно, использует ИИ для написания и запуска кода, а затем анализирует результаты как с помощью людей, так и с применением ИИ-инструментов. Это описание подтвердила Дианна Пенн (Dianne Penn), руководитель направления управления продуктами, исследований и передовых технологий в Anthropic, назвав его «в целом верным».

Ещё в октябре глава Anthropic Дарио Амодеи (Dario Amodei) сообщил, что ИИ Claude уже пишет 90 % кода для большинства команд внутри компании. При этом он отметил, что это не приведёт к сокращению инженеров, а скорее наоборот, увеличит в них потребность, так как люди смогут сосредоточиться на самой сложной 10-процентной части работы или на контроле группы ИИ-моделей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft представила Copilot Cowork — автономного ИИ-агента для сложных задач на базе моделей Anthropic 2 ч.
Anthropic подала в суд на власти США из-за включения её в «чёрный список» Пентагона 2 ч.
Журналисты выяснили, какую игру делает новая студия создателя Resident Evil и The Evil Within 4 ч.
«Щикарно»: GamesVoice анонсировала русскую озвучку South Park: The Stick of Truth с теми самыми голосами 6 ч.
Боевик Samson: A Tyndalston Story от создателя Just Cause получил системные требования — оперативной памяти нужно больше, чем места на SSD 7 ч.
Google Translate научится закреплять до десятка часто используемых языков 7 ч.
Новый трейлер раскрыл дату выхода психологического хоррора на четверых The Mound: Omen of Cthulhu 8 ч.
ИИ должен был заменить консультантов, но спрос на них только растёт — из-за массового внедрения ИИ 11 ч.
tinyBuild похвасталась продажами The King is Watching — российской стратегии, где никто не работает, если за ним не следить 12 ч.
ИИ-модель Anthropic Claude обнаружила 22 уязвимости в Mozilla Firefox за две недели — из них 14 весьма серьёзны 13 ч.
Новая статья: Компьютер месяца — март 2026 года 7 мин.
Intel представила процессоры Bartlett Lake только с P-ядрами, но в обычные ПК они не попадут 9 мин.
MSI выпустила доступную плату MAG B850M Gaming Pro Max WIFI улучшениями для разгона и PCIe 5.0 x16 13 мин.
Intel расскажет о настольных процессорах Core Ultra 200 Plus и Core Ultra 200HX Plus через неделю 20 мин.
Samsung скоро выпустит смартфоны Galaxy A57 и Galaxy A37 — утечка раскрыла их характеристики 2 ч.
Google выделила $50 млн на устранение суперзагрязнителей из окружающей среды 2 ч.
Ubitium стала на шаг ближе к выпуску универсального RISC-V процессора, заменяющего CPU, GPU, DSP и FPGA 8 ч.
Представлен Realme Note 80 — смартфон за $105 с 4 Гбайт оперативной памяти и батареей на 6300 мА·ч 9 ч.
MaxSun выпустила пару «двуглавых» видеокарт Arc Pro B60 Dual без вентиляторов 9 ч.
Договаривайтесь заранее: Sandisk пообещала скидки предусмотрительным клиентам с долгосрочными контрактами 9 ч.