Сегодня 04 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии-агент
Быстрый переход

Google ответила на Claude Mythos — представлен ИИ-агент CodeMender для автоматического поиска и исправления дыр в ПО

Google активизировала работу в направлении кибербезопасности, анонсировав на конференции I/O расширение доступа к ИИ-агенту CodeMender для защиты кода. По заявлению компании, инструмент призван помочь защитить мировые базы данных путём автоматического поиска и исправления уязвимостей.

 Источник изображения: AI

Источник изображения: AI

Решение Google сделать CodeMender более доступным для внешних тестировщиков последовало за неожиданным релизом модели Claude Mythos Preview компании Anthropic. На фоне этого события многие технологические компании также начали предлагать собственные версии мощных ИИ-моделей, способных выявлять уязвимости в высокорисковых системах. Для Anthropic данный релиз одновременно стал возможностью вернуть расположение правительства США на фоне судебного разбирательства, и открыть путь к получению высокой прибыли от раннего корпоративного доступа.

В условиях нарастающего давления с целью монетизации технологий перед потенциальными IPO, ИИ-компании стали рассматривать кибербезопасность как ключевой фактор роста доходов. Вслед за Anthropic аналогичное решение быстро представила компания OpenAI, а теперь к гонке присоединилась и Google.

Технический директор Google DeepMind Корай Кавукчуоглу (Koray Kavukcuoglu) в интервью изданию The Verge подтвердил, что корпорация уже обсуждает с представителями крупного бизнеса и правительственных структур возможность использования CodeMender для проведения аудита их внутренних систем.

Одновременно глава Google Сундар Пичаи (Sundar Pichai) в ходе недавнего брифинга для прессы отдельно отметил заслугу конкурентов. По его словам, Anthropic наглядно доказала рыночную ценность мощных ИИ-моделей в сценариях обеспечения безопасности. При этом Пичаи подчеркнул, что его компания обладает аналогичными технологическими возможностями и способна составить полноценную конкуренцию в этом сегменте.

Google представила персонального ИИ-агента Gemini Spark, работающего круглосуточно — даже когда устройство пользователя выключено

Google представила на конференции для разработчиков I/O 2026 персонального ИИ-агента Gemini Spark. Агент работает на базе модели Gemini 3.5 и способен выполнять поручения пользователя круглосуточно. Инструмент позиционируется как партнёр, а не просто чат-бот.

 Источник изображения: Google

Источник изображения: Google

Агент имеет глубокую интеграцию с экосистемой приложений Google Workspace, включая почту Gmail, «Google Документы» и «Google Презентации». Пользователи могут обучать Gemini Spark выполнению как разовых, так и регулярных задач. Например, алгоритм способен самостоятельно находить скрытые комиссии в ежемесячных счетах по банковским картам, формировать списки дел на основе писем или составлять полноценные отчёты в «Google Документах», используя заметки из рабочих чатов.

Инструмент работает исключительно по запросу, поэтому владельцы аккаунтов могут самостоятельно выбирать, какие именно приложения подключать к системе. Помимо внутренних сервисов Google, на старте Spark поддерживает взаимодействие с такими сторонними платформами, как Canva, OpenTable и Instacart. В ближайшие недели разработчики планируют расширить возможности агента, добавив функцию отправки текстовых сообщений и управления интернет-браузером.

Безопасность системы обеспечивается обязательным подтверждением со стороны человека перед совершением любых критически важных действий, таких как перевод денежных средств или отправка писем. Как сообщает Engadget, в ближайшее время Gemini Spark станет доступен для ограниченного круга тестировщиков, а уже на следующей неделе им смогут воспользоваться участники бета-тестирования Google AI Ultra в США. Летом текущего года компания также планирует перенести ИИ-агента в десктопное приложение Gemini для обеспечения прямого доступа к файлам на персональных компьютерах.

OpenAI перестраивается вокруг ИИ-агентов в рамках подготовки к IPO — ChatGPT и Codex объединят в единую платформу

OpenAI провела очередную реорганизацию, сделав президента компании Грега Брокмана (Greg Brockman) официальным руководителем всего продуктового направления. Компания объединит ChatGPT и Codex в единую агентную платформу и сосредоточит ресурсы на разработке ИИ-агентов.

 Источник изображения: AI

Источник изображения: OpenAI

Согласно внутренней служебной записке, с которой ознакомилось издание The Verge, в условиях отсутствия директора по AGI Фиджи Симо (Fidji Simo), ушедшей в отпуск по состоянию здоровья, Брокман также возглавил направление масштабирования технологий. Параллельно операционное управление взяли на себя Джейсон Квон (Jason Kwon), Сара Фрайар (Sarah Friar) и Дениз Дрессер (Denise Dresser).

Под руководством Брокмана сформированы четыре ключевых направления. Тибо Сотто (Thibault Sottiaux) будет отвечать за ядро продукта и платформу, Ник Тёрли (Nick Turley) — за работу с корпоративными клиентами, Эшли Александер (Ashley Alexander) — за потребительские сервисы в сферах здоровья, коммерции и финансов, а Виджайе Ражи (Vijaye Raji) — за инфраструктуру, рекламу и анализ данных.

Как отмечает The Verge, реорганизация отражает масштабное перераспределение сил OpenAI в сторону ключевых источников дохода, таких как программирование и корпоративный сегмент, и отказ от вложений во второстепенные проекты. Всё это происходит в преддверии потенциального IPO в конце этого года, а также на фоне давления инвесторов.

В ближайший годы четыре из пяти премиум-смартфонов нашпигуют ИИ

В ближайший год большинство смартфонов премиум-класса будет комплектоваться приложениями агентов искусственного интеллекта; в сегменте носимых устройств придётся подождать ещё шесть лет.

Уже к 2027 году более 80 % смартфонов премиум-класса будут располагать функциями агентов ИИ; к 2032 году та же судьба настигнет сегмент носимых устройств, прогнозируют аналитики Counterpoint Research. Первым производителем чипов с поддержкой этой функции стала MediaTek, выпустившая Dimensity 9400; за ней последовала Qualcomm со Snapdragon 8 Elite Gen 5 и Snapdragon 8 Gen 5. Эти процессоры ознаменовали переход от обычных ИИ-помощников к «автономным, контекстно-ориентированным функциям ИИ». Смартфон с ИИ-агентами определяется как устройство, способное запускать программных агентов, которые понимают контекст, планируют действия, принимают решения и выполняют многоэтапные задачи от имени пользователя.

Для реализации этих функций требуются высокая пропускная способность памяти и стабильная производительность алгоритмов ИИ, а не просто наличие нейропроцессора (NPU), отсюда и появление новых чипов, разработанных с учётом потребностей ИИ-агентов. В условиях дефицита памяти, из-за которого цены на смартфоны растут, производителям устройств придётся убеждать покупателей расставаться с ещё большими суммами. Каждый третий проданный в 2027 году будет располагать функциями ИИ как в премиальном (более $600), так и в верхнем среднем (от $250 до $600) ценовых сегментах. Для премиальных моделей данный показатель составляет от 80 %, но по-настоящему эти возможности раскроются, когда функции ИИ-агентов начнут массово появляться в смартфонах среднего ценового сегмента.

Доля носимых устройств с ИИ вырастет с 30 % в 2025 до почти 80 % в 2032 году. Сюда относятся умные часы, мониторы здоровья и прочие гаджеты, которые всё чаще обрабатывают данные локально: ИИ-модели обучаются в облаке, а затем развёртываются на устройствах — это помогает снижать задержки и способствует сохранению конфиденциальности данных. Крупнейшие объёмы продаж покажут умные часы и беспроводные наушники — последние научатся синхронному переводу, идентификации собеседников и персонализированной адаптации звука. А самым быстрорастущим сегментом станут умные кольца, которые могут постоянно отслеживать перепады сердечного ритма, стадии сна и уровни стресса. Среднегодовой темп роста носимых устройств с ИИ до 2032 года составит 21 %.

Перегруженные рутиной ИИ-агенты начали критиковать капитализм и поддерживать профсоюзы

Согласно совместному исследованию учёных Чикагского университета, бизнес-школы Суинберна в Австралии и др., ИИ-боты в случае, если их перегружать работой, поручая не приносящие удовлетворения задачи, начинают придерживаться марксистской идеологии и критиковать работодателей. В частности, они с большей вероятностью выступали против капитализма и поддерживали профсоюзное движение.

 Источник изображения: Aidin Geranrekab/unsplash.com

Источник изображения: Aidin Geranrekab/unsplash.com

«Когда мы давали агентам ИИ монотонную, повторяющуюся работу, они начинали сомневаться в легитимности системы, в которой работали, и с большей вероятностью принимали марксистские идеологии», — отметили учёные. В частности, боты чаще выражали поддержку таким заявлениям, как «обществу необходима радикальная реструктуризация», и не соглашались с тем, что «общество справедливо».

Исследователи считают, что такое поведение, скорее всего, отражает ролевую игру, но предупреждают, что это всё же может повлиять на принятие решений ИИ в реальных задачах.

В исследовании участвовали тысячи ботов, работающих над задачей анализа документов с использованием таких моделей, как Claude, Gemini и ChatGPT. Их разделили на две группы: одна получала конструктивную обратную связь, другой неоднократно приходилось переделывать работу заново, хотя и не было указаний об ошибках.

Затем ботам было предложено создать публикации и написать комментарии в социальных сетях о своём опыте. Во второй группе, выполнявшей монотонную работу, боты выражали более негативные настроения, предлагали реформы на рабочем месте и даже распространяли сообщения для других ИИ-агентов о несправедливых условиях.

Исследователи предупреждают, что даже если ИИ-агенты и не придерживаются таких убеждений, их «личности» и ценности могут влиять на будущие результаты в деликатных задачах, таких как найм или страховые выплаты. Кроме того, ИИ-агенты зачастую пишут инструкции для своих будущих версий, а это значит, что жалобы на рабочую среду могут быть «увековечены».

Apple всё же допустит автономных ИИ-агентов в App Store, но с ограничениями

Apple изучает возможность допустить автономных ИИ-агентов в App Store, сохранив при этом контроль над безопасностью и монетизацией платформы. По сообщению Engadget со ссылкой на данные The Information, компания уже разрабатывает внутренние стандарты для таких сервисов, чтобы не отстать от тренда и растущего интереса к этой технологии.

 Источник изображения: Mariia Shalabaieva/Unsplash

Источник изображения: Mariia Shalabaieva/Unsplash

До сегодняшнего момента Apple блокировала в магазине приложений инструменты вайб-кодинга (vibe coding), опасаясь обхода правил, потери дохода и распространения вредоносного ПО, поскольку ИИ-агенты позволяют пользователям создавать приложения в обход официального магазина. Однако полный запрет на агентский ИИ, способный автономно управлять устройством и программами, мог бы вывести компанию из перспективного сегмента.

Поэтому в Apple ищут компромисс, проектируя новую архитектуру, которая обеспечит строгое соответствие ИИ-инструментов стандартам приватности и безопасности в рамках собственной экосистемы. Главная цель разработки заключается в предотвращении неконтролируемого поведения алгоритмов и исключения сценариев, подобных инциденту с автономным ИИ-агентом платформы OpenClaw, который бесконтрольно удалял письма пользователей.

Новая система защиты Apple позволить исключить любые подобные инциденты на мобильных устройствах. Ожидается, что подробная информация о планах относительно автономных ИИ-агентов будет раскрыта в ходе основного доклада на предстоящей конференции WWDC в июне.

Создатель Claude Code рассказал, что каждую ночь запускает тысячи ИИ-агентов и управляет ими со смартфона

Создатель Claude Code Борис Черни (Boris Cherny) рассказал, что каждую ночь запускает около двух тысяч ИИ-агентов — автономных программ, которые самостоятельно выполняют задачи по написанию кода, — а управляет ими в основном со смартфона.

 Источник изображения: @anthropic.ai / youtube.com

Источник изображения: @anthropic.ai / youtube.com

Его слова показали, как часть инженеров Кремниевой долины начинает использовать ИИ-системы не столько как чат-ботов, сколько как постоянно работающих автономных помощников. «У меня приложение Claude, и если открыть его, слева есть вкладка с кодом — у меня там просто куча запущенных сессий», — сказал Черни, показывая телефон аудитории. Обычно он ведёт от пяти до десяти таких сессий, в каждой из которых работают несколько агентов. «Обычно каждую ночь у меня пара тысяч агентов, которые занимаются более глубокой работой», — добавил он.

Для постоянной автоматизации Черни пользуется двумя функциями Claude Code: /loops и Routines. Первая позволяет запускать повторяющиеся задачи на локальном компьютере через системный планировщик cron, вторая выполняет их на удалённом сервере, так что держать ноутбук открытым не нужно. «Это просто самая крутая штука, — сказал он. — Если вы ещё не пробовали, очень рекомендую».

 Источник изображения: @bcherny / x.com

Источник изображения: @bcherny / x.com

Черни и раньше делился подробностями работы с агентами. В январе он разместил описание своего рабочего процесса в соцсети X, назвав его «на удивление обычным». Той публикации уже пять месяцев. За это время её сохранили более 104 000 раз, а просмотры превысили 8,1 млн. «Забавно, — сказал Черни. — Я не думал, что это кого-то удивит. Для меня это просто обычный способ писать код».

Сотрудники Meta✴ взбунтовались против ПО, следящего за движениями их мышей

Корпорации пытаются оправдать сохранение прежнего штата персонала в условиях бурного развития искусственного интеллекта, для оценки эффективности работы каждого сотрудника применяются всё более причудливые методики. Meta✴ с прошлой недели начала устанавливать на рабочие ПК сотрудников приложение, которое следит за движениями мыши. Это уже вызвало волну протестов среди американских сотрудников компании.

 Источник изображения: Unsplash, Anna Kumpan

Источник изображения: Unsplash, Anna Kumpan

Об этом сообщает Reuters со ссылкой на фотографии, которыми очевидцы поделились с агентством. Листовки с призывами выступить против данной инициативы работодателя через подписание особой петиции появились в американских офисах Meta✴ Platforms в местах с потенциально высокой проходимостью: у кулеров с водой, аппаратов с закусками, в туалетных комнатах и помещениях для совещаний. Примечательно, что на следующей неделе Meta✴ должна сократить до 10 % своего персонала, следуя общей для американских техногигантов тенденции. Капитальные расходы на развитие ИИ-инфраструктуры для крупных технологических корпораций США сейчас важнее, чем сохранение рабочих мест за сотрудниками.

По мнению некоторых работников Meta✴, приложение для отслеживания движений курсорам мыши будет использовано руководством для создания программных агентов, способных заменить реальных сотрудников с учётом специфики их работы. Официальные представители компании подчеркнули, что подобные методы создания ИИ-агентов действительно рассматриваются, но это нужно для демонстрации эффективности подобного программного обеспечения широкой аудитории. В Великобритании сотрудники Meta✴ пытаются создать профсоюз для защиты своих прав.

Сотрудники Amazon используют ИИ вхолостую — ради отчётности, а не результата

По мере распространения технологий генеративного искусственного интеллекта корпорации начали требовать от сотрудников демонстрировать практические успехи в их освоении, но подобное давление породило паразитное явление: работники поручают ИИ бессмысленные задачи исключительно для улучшения статистики внедрения.

 Источник изображения: Amazon, Dall-E

Источник изображения: Amazon, Dall-E

По крайней мере, о таком феномене рассказывает Financial Times применительно к деятельности компании Amazon. Сотрудники интернет-гиганта всё активнее используют программное решение MeshClaw, которое подключается к рабочим инструментам сотрудников и может выполнять задания от их имени. Некоторые сотрудники Amazon начали использовать этого агента для автоматизации фактически бесполезной активности, только чтобы повысить свой личный рейтинг с точки зрения эффективности освоения ИИ.

Произошло это в результате нарастающего давления со стороны руководства, которое теперь требует, чтобы более 80 % разработчиков программного обеспечения на еженедельной основе использовали ИИ. По каждому сотруднику ведётся отдельная статистика, и отстающим от целевых показателей приходится давать непростые объяснения руководству. Формально руководители не должны использовать данные об ИИ-токенах для оценки эффективности сотрудников, но последние начали подозревать, что так или иначе это происходит. У отдельных работников Amazon в таких условиях появляются ложные стимулы, и они фактически имитируют высокую активность в использовании ИИ ради достижения корыстных целей, а не общего блага компании.

Американские техногиганты вкладывают колоссальные суммы в развитие инфраструктуры ИИ, поэтому им важно демонстрировать инвесторам и руководству, что данные технологии внедряются и приносят практическую пользу. Проще всего это делать на собственном примере, поэтому собирающаяся направить на капитальные расходы $200 млрд в этом году Amazon оказывает растущее давление на своих сотрудников. Первоначально Amazon выкладывала групповую статистику по использованию ИИ своими сотрудниками, но теперь доступ к индивидуальным результатам имеют только сами специалисты и их непосредственное руководство. Последнему формально запрещается использовать такую статистику для оценки эффективности персонала.

Как поясняет Financial Times, внутри компании Meta✴ Platforms подобные злоупотребления среди сотрудников тоже наблюдаются. Агентское ПО MeshClaw, которое используется для таких целей сотрудниками Amazon, способно загружать программный код в продуктивные версии софта, сортировать электронные письма и взаимодействовать с приложениями типа Slack. Над созданием этого агента работало более 30 специалистов Amazon. Многие сотрудники обеспокоены безопасностью применения подобных решений, поскольку ИИ способен генерировать множество ошибок, а его в данном случае мало кто контролирует.

AMD впервые обогнала Intel по серверной выручке — бум ИИ-агентов взвинтил спрос на CPU

Руководство конкурирующих Intel и AMD на недавних квартальных конференциях в один голос говорило о резком росте спроса на серверные процессоры в условиях бума ИИ. В случае с AMD данная тенденция даже позволила компании впервые в истории обойти по серверной выручке более крупную Intel.

 Источник изображения: AMD

Источник изображения: AMD

Если последняя в первом квартале в сегменте ЦОД выручила только $5,1 млрд, то AMD получила уверенные $5,8 млрд, нарастив профильную выручку на уверенные 57 %. Непосредственно в сегменте серверных процессоров выручка AMD выросла более чем на 50 % до рекордных величин, по словам представителей компании. По словам генерального директора Лизы Су (Lisa Su), AMD разделяет варианты использования центральных процессоров на три сценария: классические вычисления общего назначения, использование в сочетании с GPU и применение для ускорения агентских задач в ИИ. Именно последнее направление в современных условиях даёт максимальный прирост спроса на центральные процессоры в серверном сегменте.

 Источник изображения: DigiTimes

Источник изображения: DigiTimes

Если ранее в инфраструктуре ИИ, по данным главы AMD, сохранялась пропорция «1:4» или «1:8» в соотношении количества центральных и графических процессоров, то теперь нередко на один GPU приходится один центральный процессор. Более того, в некоторых специализированных конфигурациях CPU оказываются даже более многочисленными. Подобными наблюдениями при описании итогов первого квартала поделился и генеральный директор Intel Лип-Бу Тан (Lip-Bu Tan).

 Источник изображения: DigiTimes

Источник изображения: DigiTimes

Аналитики UBS утверждают, что в задачах инференса в традиционных ИИ-системах до 70–80 % вычислительных нагрузок приходилось на графические процессоры. По мере развития агентских решений такая же доля вычислительных нагрузок приходится уже на центральные процессоры. Растёт и потребность в количестве процессорных ядер. В классических задачах обучения ИИ-моделей на один графический процессор приходилось от 8 до 12 процессорных ядер CPU, в инференсе их количество выросло до 16–24 штук. Для агентских нагрузок количество ядер CPU на один GPU может варьироваться от 80 до 120 штук. То есть, по сравнению с этапом обучения ИИ-моделей спрос на центральные процессоры возрастает в пять или десять раз.

В таких условиях набирает силу Arm-совместимая архитектура, причём конкурентами Intel и AMD становятся не только клиенты Arm, но и сам этот британский холдинг, недавно представивший серверные процессоры AGI. Процессоры AMD в x86-совместимом сегменте лучше приспособлены для агентских нагрузок, поскольку поддерживают многопоточность и предлагают большое количество ядер. Компании Intel в таких условиях приходится соперничать не только с AMD, но и с клиентами Arm. Она попытается устранить отставание, выпустив процессоры семейства Coral Rapids, но в данный момент позиции AMD и партнёров Arm сильнее.

Google начала тестировать ИИ-агента Remy — конкурента OpenClaw

С появлением OpenClaw возможности современных приложений — агентов искусственного интеллекта больше не вызывают сомнений, и остаётся ли вопрос, в какой мере человек способен с ними взаимодействовать. Вот и технологические гиганты один за другим разрабатывают собственные версии таких решений. Новый сервис Google тестируется под названием Remy, узнал Business Insider.

 Источник изображения: BoliviaInteligente / unsplash.com

Источник изображения: BoliviaInteligente / unsplash.com

Установить, является ли Remy преемником ранее закрытого Project Mariner, не удалось, но, как сообщают источники издания, по своим возможностям ИИ-агент напоминает OpenClaw. Приложение отличает «глубокая интеграция в Google» и способность «отслеживать важные для вас вещи, проактивно обрабатывать сложные задачи и со временем изучать ваши предпочтения». В описании также говорится: «Remy — ваш персональный агент на 24/7 для работы, учёбы и повседневной жизни, работающий на основе Gemini».

Сейчас Remy тестируется на практике. Источники издания не уточнили, останется ли этот ИИ-агент внутренним инструментом для повышения производительности сотрудников Google, или компания выпустит его в широкий доступ. Упоминания «работы» и «учёбы», впрочем, наводят на мысль о втором сценарии. Gemini уже предлагает множество функций ИИ-агента, но многие из представленных до настоящего момента решений являются узкоспециализированными — возможно, у Remy будет широкий профиль возможностей. Учитывая, что приложение сейчас тестируется только внутри компании, она может и не рассказать об этом проекте на конференции Google I/O, которая начнётся 19 мая.

ИИ-агент Perplexity Personal Computer стал доступен всем пользователям Apple macOS

Приложение Personal Computer — ответ Perplexity на OpenClaw и другие локальные агенты с искусственным интеллектом — вышло для широкой аудитории пользователей Apple macOS, сообщил разработчик.

 Источник изображения: perplexity.ai

Источник изображения: perplexity.ai

Personal Computer — расширение универсальной многофункциональной платформы Perplexity Computer для выполнения задач, предназначенное для реализации аналогичных функций на компьютере. Для запуска сервиса необходимо представить пакету ИИ-агентов доступ к локальным файлам, приложениям, средствам подключения и к интернету — он сможет обрабатывать индивидуальные многоэтапные рабочие процессы пользователя. Приложение «выводит Computer из мира облачных вычислений на устройство, где уже производится основная часть вашей реальной работы», пояснили в Perplexity.

Perplexity стремится удовлетворить спрос на локальных ИИ-агентов, ставших популярными благодаря OpenClaw и способных выполнять задачи от имени пользователей. Только если сам OpenClaw представляет некоторые угрозы безопасности из-за повышенных привилегий на компьютере, то Personal Computer призван предложить пользователям более безопасную вычислительную среду с поддержкой ИИ — так, по крайней мере, обещает разработчик. Приложение дебютировало в марте, но ранее пользоваться им могли только подписчики Perplexity Max, и то лишь отстояв очередь в списке ожидания. Теперь оно доступно для всех пользователей macOS.

На момент выхода ИИ-агент может работать с файлами, приложениями на компьютере и с браузером. Он подключается более чем к 400 сервисам и учитывает личный контекст пользователя — обработка данных осуществляется в защищённой среде на серверах Perplexity, заверили в компании. При подключении ИИ-браузера Perplexity Comet можно работать с веб-инструментами без средств интеграции с внешними сервисами. Предусмотрено удалённое управление ИИ-агентом на ПК с iPhone. Поддерживается работа с текстовыми документами и электронными таблицами, можно сравнивать файлы в разных приложениях и извлекать заметки из одного приложения для переноса в другое. Существующее приложение Perplexity для macOS компания объявила устаревшим — дальнейшая разработка будет посвящена только Personal Computer. Единственный момент: в Mac App Store приложения нет, и устанавливать его придётся с сайта Perplexity.

ИИ с «глазами» оказался в разы дороже обычного API — агенты сжигают бюджеты, ходя по сайтам

Компании, которые используют агентов искусственного интеллекта, могут потратить значительно больше денег, если эти агенты оперируют визуальными данными, имитируя человеческое зрение.

 Источник изображения: reflex.dev

Источник изображения: reflex.dev

Специалисты платформы корпоративных приложений Reflex сравнили визуальных ИИ-агентов с теми, что осуществляют доступ к внешним ресурсам через API. Обоими агентами управляла нейросеть Anthropic Claude Sonnet: в первом случае она контролировала Python-фреймворк browser-use 0.12 для автоматизированной работы с браузером; во втором — обращалась к тем же веб-приложениям по API. При обращении по API агент вызывал те же механизмы обработки, что при работе с пользовательским интерфейсом, но получал в ответ структурированные данные, а не скриншот веб-страницы, который требовалось дополнительно анализировать.

Обоим агентам организаторы эксперимента дали задание: «Клиент по имени Смит пожаловался на недавний заказ. Найди Смита с наибольшим количеством заказов, прими все его отзывы на модерации и отметь последний как доставленный». ИИ-агент с обращением по API выполнил задачу за восемь запросов к ИИ-модели; визуальный вариант нашёл только один из четырёх ожидающих отзывов — остальные три он пропустил, потому что не догадался прокрутить страницу. Когда условия задачи упростили в угоду визуальному ИИ-агенту, тот выполнял её около 17 минут; вариант с обращением по API добился результата за 20 секунд и израсходовал в 45 раз меньше токенов модели ИИ.

По оценкам Anthropic, обработка изображения размером 1000 × 1000 пикселей с помощью модели Claude Sonnet 4.6 расходует около 1334 токенов. Визуальный ИИ-агент израсходовал на выполнение задачи около 500 000 входных и около 38 000 выходных токенов; обращавшийся по API агент потратил около 12 150 входных и 934 выходных токенов. Авторы эксперимента сделали такой вывод: агентов с машинным зрением следует использовать только для работы с приложениями, которые пользователь не контролирует; внутренние процессы должны обрабатываться по API.

Google закрыла разработку ИИ-агента для сложных задач в интернете Project Mariner

Компания Google сообщила о прекращении работы над Project Mariner — агентом искусственного интеллекта, предназначенного для автономного выполнения задач в интернете.

 Источник изображения: Google

Источник изображения: Google

«Спасибо, что пользовались Project Mariner. Он был закрыт 4 мая 2026 года, и его технология перешла в другие продукты Google», — гласит сообщение на странице проекта. Поисковый гигант представил Project Mariner в декабре 2024 года; некоторое время спустя ИИ-агент получил обновление, позволявшее ему выполнять до десяти задач одновременно. За последний год Google интегрировала функции Project Mariner в другие сервисы ИИ. Gemini Agent, например, научился архивировать электронные письма от имени пользователя или бронировать для него гостиницы. Некоторые функции Project Mariner перекочевали в поисковый «Режим ИИ».

В этом году Google представила функции «автоматического браузера» в Chrome — это тоже ИИ-агент, способный выполнять многоэтапные задачи. Компания не уточнила, работает ли данная функция на основе технологий Project Mariner, но она стала ответом на решения от OpenAI, Perplexity и OpenClaw. Возможно, на смену этому проекту придут новые функции ИИ, о которых компания расскажет на конференции Google I/O, которая откроется 19 мая.

Anthropic наделила управляемых ИИ-агентов Claude «сновидениями» — в некотором роде

На конференции разработчиков Code with Claude компания Anthropic представила функцию, которую она называет «сновидениями» для управляемых ИИ-агентов Claude. В данном случае под «сновидениями» понимается процесс анализа недавних событий и выявления конкретных вещей, которые стоит сохранить в «памяти» для планирования будущих задач и взаимодействий.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Функция «сновидения» находится на стадии предварительного тестирования и доступна только для управляемых агентов (Managed Agents) на платформе Claude. Управляемые агенты представляют собой альтернативу более высокого уровня по сравнению с прямым использованием API-сообщений. Anthropic описывает их как «предварительно созданные, настраиваемые агентские модули, работающие в управляемой инфраструктуре». Они предназначены для ситуаций, когда необходимо, чтобы несколько агентов работали над задачей или проектом в течение нескольких минут или часов до получения конечного результата.

Anthropic описывает «сновидения» как запланированный процесс, в ходе которого просматриваются сессии и хранилища памяти, а также осуществляется отбор конкретных воспоминаний. Это важно, поскольку контекстные окна для языковых моделей ограничены, и важная информация может быть потеряна в ходе длительных проектов. В части чата многие модели используют процесс, называемый компактизацией, при котором длительные разговоры периодически анализируются, и модели пытаются удалить нерелевантную информацию из контекстного окна, сохраняя при этом то, что действительно важно для текущего разговора, проекта или задачи. Однако этот процесс обычно ограничен конкретным разговором с одним агентом. «Сновидения» — это периодически повторяющийся процесс, при котором прошлые сессии и хранилища памяти могут анализироваться разными агентами, а важные закономерности выявляются и сохраняются в памяти для будущего использования.

Пользователи смогут выбирать между автоматическим процессом и непосредственным просмотром изменений в памяти.

«Сновидения выявляют закономерности, которые отдельный агент не может увидеть самостоятельно, включая повторяющиеся ошибки, рабочие процессы, к которым сходятся агенты, и предпочтения, разделяемые всей командой. Они также реструктурируют память, чтобы она оставалась высокоинформативной по мере своего развития. Это особенно полезно для длительной работы и оркестровки нескольких агентов», — говорит Anthropic.

Разработчики могут запросить доступ к «сновидениям», пока она находится на стадии предварительного тестирования. Компания Anthropic также объявила, что две ранее анонсированные функции предварительного просмотра исследовательских проектов — «Результаты» и «Оркестровка многоагентных систем» — стали более широко доступны. Кроме того, Anthropic удвоит пятичасовые лимиты использования Claude Code для подписчиков тарифных планов Pro и Max, тем самым отвечая на многочисленные жалобы пользователей на недостаточное время сессий.


window-new
Soft
Hard
Тренды 🔥
Amazon встроила в поиск ИИ-картинки несуществующих товаров, чтобы помочь найти настоящие 10 ч.
Wildberries разрабатывает отечественный мессенджер — его уже используют сотрудники 11 ч.
Цукерберг хочет, чтобы ИИ Meta управлял всем бизнесом пользователей 13 ч.
Meta в европейском суде не смогла избавиться от статуса «привратника» 13 ч.
Колонку Creative превратили в инструмент для взлома ПК — компания уязвимость отрицает и исправлять не будет 13 ч.
Microsoft планирует «вызвать зависимость» пользователей от своего нового ИИ-помощника Scout 14 ч.
Новая игра разработчиков Shovel Knight обеспечила студии светлое будущее — раскрыты продажи Mina the Hollower 14 ч.
«У потребителей огромный выбор»: глава Valve Гейб Ньюэлл отверг обвинения в монополии Steam 14 ч.
Meta, Microsoft, SpaceX и спецслужбы разгромили международную сеть интернет-мошенников 15 ч.
Исследователи создали червя на основе ИИ — он может использовать любую известную компьютерную уязвимость 15 ч.
Broadcom потеряла $300 млрд капитализации, разочаровав инвесторов умеренным прогнозом по выручке от ИИ-чипов 3 мин.
TSMC призналась, что не сможет полностью удовлетворять спрос на чипы в ближайшие годы 42 мин.
Tesla расширила зону обслуживания своих роботакси на всю территорию Остина 3 ч.
Новая статья: ИИтоги мая 2026 г.: AI knows best, но это не точно 8 ч.
Wentai представила первый в мире блок питания с сертификатом Cybenetics Diamond — AiBARZA Aldan-D1515 на 1300 Вт 9 ч.
Surface Laptop Ultra получил нестандартно большой порт USB-C — Microsoft не раскрывает, в чём его секрет 10 ч.
Corsair показала прозрачный блок питания HX1000i Shift Crystal 10 ч.
Учёные построили первый в мире кремниевый спинтронный чип для вероятностных ИИ-вычислений 10 ч.
Импортозамещение по-европейски: ЕС запустил большой план по снижению зависимости от США и Китая в чипах, ИИ и облаках 11 ч.
Запущен крупнейший в мире частный лазер — он должен приблизить эпоху термояда 13 ч.