Сегодня 19 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Инженеры проиграли ИИ: модель Claude Opus 4.5 справилась с заданием Anthropic лучше любого из людей

Anthropic вчера объявила о выпуске новой флагманской модели искусственного интеллекта Claude Opus 4.5. Позже компания рассказала, что в двухчасовом задании, предлагаемом самой Anthropic при найме сотрудников на инженерные позиции, Opus 4.5 показала лучший результат по сравнению с живыми участниками теста.

 Источник изображения: AI

Источник изображения: AI

По утверждению Anthropic, результат ИИ достигнут за счёт многократного решения каждой задачи и выбора лучшего из полученных ответов. Хотя тест не охватывает все компетенции, необходимые инженеру, сам факт превосходства модели над сильными кандидатами в ключевых технических аспектах заставляет предположить, что ИИ в будущем может изменить инженерию как профессию, пишет Business Insider.

Подробности содержания теста не раскрываются, но из отзывов на платформе Glassdoor известно лишь, что в 2024 году он включал четыре уровня и требовал реализации определённой системы с последующим добавлением функциональности. Неизвестно, был ли использован аналогичный формат задания при оценке новой версии Claude Opus 4.5, которая вышла спустя всего три месяца после предыдущей модели, получив улучшения не только в генерации кода, но и в создании профессиональных документов, включая таблицы Excel и презентации PowerPoint.

Данный релиз, по мнению специалистов, продолжает укреплять лидирующие позиции Anthropic в сфере ИИ для программирования. Даже компания Meta Марка Цукерберга (Mark Zuckerberg), являющаяся конкурентом в гонке ИИ, использует Claude для поддержки своего внутреннего помощника по кодированию под названием Devmate.

Методы обучения своих моделей компания держит в секрете. Однако ранее Эрик Саймонс (Eric Simons), генеральный директор стартапа Stackblitz, разработавшего сервис Bolt.new, предположил, что Anthropic, возможно, использует ИИ для написания и запуска кода, а затем анализирует результаты как с помощью людей, так и с применением ИИ-инструментов. Это описание подтвердила Дианна Пенн (Dianne Penn), руководитель направления управления продуктами, исследований и передовых технологий в Anthropic, назвав его «в целом верным».

Ещё в октябре глава Anthropic Дарио Амодеи (Dario Amodei) сообщил, что ИИ Claude уже пишет 90 % кода для большинства команд внутри компании. При этом он отметил, что это не приведёт к сокращению инженеров, а скорее наоборот, увеличит в них потребность, так как люди смогут сосредоточиться на самой сложной 10-процентной части работы или на контроле группы ИИ-моделей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Слухи: амбициозный самурайский боевик Onimusha: Way of the Sword от Capcom выйдет на три недели раньше запланированного 6 мин.
Google заявила о готовности запустить программу верификации разработчиков и приложений 52 мин.
В последнем обновлении Windows 11 сломалась «Корзина» и запуск приложений Office 2 ч.
У Google Android 17 проявились первые сбои: исчезают виджеты, отказывает Wi-Fi в приложениях 4 ч.
Alibaba Cloud делает ставку на развитие во Франции, а Европа желает получить больше контроля над ИИ-инфраструктурой 4 ч.
Глава PlayStation уклонился от ответа на вопрос о будущем эксклюзивов Sony на ПК, но инсайдер прояснил план компании 4 ч.
Telegram не смог отменить временную блокировку в Индии 5 ч.
Игроки Crimson Desert теперь могут заняться внешним обустройством дома — детали обновления 1.12.00 6 ч.
Apple открыла iOS в Бразилии, но комиссии не отменила 6 ч.
Atlus устроила демонстрацию Persona 4 Revival — 19 минут геймплея и подробности ремейка культовой японской RPG 7 ч.
Сбербанк этой осенью представит человекоподобных роботов собственной разработки 50 мин.
Потребительский SATA SSD выдержал 15 000 полных перезаписей за 16 лет и продолжает работать 55 мин.
Cloud.ru начал строительство собственного ЦОД в Московской области 2 ч.
В Тасмании начали строить «чёрный ящик Земли» — сверхзащищённый бункер с климатическим архивом планеты 2 ч.
Выход SpaceX на биржу сделал миллиардерами членов совета директоров и сотрудников компании 3 ч.
MaxSun выпустила материнские платы Mini-ITX с разъёмами MCIO вместо привычных PCIe x16 3 ч.
Россияне закупились рекордным количеством складных смартфонов 3 ч.
В китайских подделках GeForce RTX 4090 начали использовать пластиковые GPU 4 ч.
Учёные создали прототип сверхэнергоэффективного транзистора на квантовом эффекте группового поведения электронов 4 ч.
Rackspace развернёт ИИ-оборудование AMD на 30 МВт в ЦОД по всему миру 4 ч.