Сегодня 26 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → агенты
Быстрый переход

ИИ-агенты скоро станут дороже живых программистов, подсчитали аналитики Gartner

Разработчики агентов искусственного интеллекта начали переводить клиентов с фиксированных тарифов на оплату по объёму потребляемых токенов, в результате чего цены на эти продукты резко выросли. Вскоре ИИ-помощники могут оказаться дороже состоящих в штате компаний программистов, пишет The Register со ссылкой на исследование Gartner.

 Источник изображения: Arif Riyanto / unsplash.com

Источник изображения: Arif Riyanto / unsplash.com

Компании, которые занимаются разработкой ПО, столкнулись с резким ростом затрат, указывают аналитики Gartner: если раньше помогающие программистам ИИ-агенты обходились от $20 до $100 в месяц на рабочее место, то теперь цены выросли до $2000–5000, а в некоторых случаях и до $20 000 — тоже в месяц за рабочее место. При этом разработчики ПО не получают достаточно информации о том, как рассчитываются и выставляются счета за потребление токенов, что затрудняет программирование и контроль затрат.

Создатели ИИ-сервисов не предоставляют встроенных функций, позволяющих разработчикам оптимизировать затраты на ИИ-агентов — в результате расходы увеличиваются бесконтрольно. Более того, указывают аналитики, создатели систем ИИ переходят к концепции «максимизации токенов», исходя из тезиса, что это даст более качественный результат в работе, хотя прямой связи между объёмом потребления вычислительных ресурсов и повышением качества работы установить не удалось.

Для решения проблемы аналитики Gartner рекомендуют оптимизировать потребление токенов: повышать качество входного контекста, который подаётся на модели ИИ, а также применять маршрутизацию моделей, отправляя повседневные задачи более простым и используя передовые только для самых сложных задач. Другими словами, если между объёмом потребления вычислительных ресурсов и качеством результата работы прямой связи нет, то между оптимизацией потребления и качеством результатов она есть.

В отсутствие штатных средств оптимизации некоторые компании стали тратить больше средств на ИИ, чем зарабатывать, и если так пойдёт дальше, то уже к 2028 году затраты на используемых в написании кода ИИ-агентов превысят уровень зарплаты программистов. Учитывая, что стоимость работы ИИ-агентов одинакова во всех регионах, за те же деньги в Индии можно будет нанять инженера с опытом работы от четырёх до шести лет, делают неутешительный вывод аналитики Gartner.

Tencent начала тестировать ИИ-агента на базе DeepSeek в корпоративной версии WeChat

Tencent начала подготовку к запуску агента искусственного интеллекта в корпоративном мессенджере. Китайские технологические гиганты усилили ожесточённую борьбу за привязку пользователей к своим экосистемам, передаёт Bloomberg.

 Источник изображения: tencent.com

Источник изображения: tencent.com

ИИ-агент уже начал развёртываться для некоторых пользователей мессенджера WeCom — корпоративной версии популярного в Китае суперприложения WeChat, рассказал глава отдела по связям с общественностью Tencent Чжан Цзюнь (Zhang Jun). Помощник, получивший название Dayuan, работает на базе модели DeepSeek V4 и поддерживает запросы на естественном языке.

Dayuan обещает стать серьёзным рабочим инструментом, способным использовать огромные массивы данных, присутствующие в WeCom. ИИ-агент анализирует групповые чаты, переписку по электронной почте и записи в корпоративном календаре — он помогает эффективнее оценивать отзывы клиентов и оптимизирует взаимодействие с ними. Приложение умеет автоматизировать повторяющиеся задачи, составляя ежедневные отраслевые обзоры и готовя еженедельные отчёты.

Tencent сейчас выступает в качестве догоняющей сегменте ИИ, уступая таким игрокам как Alibaba и ByteDance. Корпоративный мессенджер WeCom является прямым конкурентом Alibaba DingTalk и ByteDance Lark на китайском рынке рабочих приложений. Эти приложения служат интерфейсом для облачных подразделений китайских техногигантов — их клиенты сейчас наращивают потребление токенов. Преимущество WeCom состоит в интеграции с популярной в стране потребительской экосистемой WeChat — обладая им, Tencent стремится укрепить свои позиции.

Компании начали считать деньги при внедрении ИИ, во многих случаях оно замедляется

В сфере внедрения генеративного искусственного интеллекта, как отмечает Financial Times, наметились важные структурные изменения, которые заставляют клиентов пересматривать свой подход к финансированию процесса. Агентские решения вызывают рост расходов корпораций, и теперь они начали более вдумчиво оплачивать внедрение ИИ.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Во многом такому перелому способствовала политика разработчиков ИИ типа OpenAI и Anthropic, которые после анализа собственных затрат поняли, что субсидируют многих клиентов, предоставляя им почти неограниченный доступ к вычислительным ресурсам в рамках подписки. Многие клиенты потребляют так много токенов, что расходы не покрываются выплатами в форме абонентской платы. Переход на соразмерную оплату потребляемых вычислительных ресурсов ужаснул многих клиентов. Например, небольшой разработчик ПО Workato после перехода на пропорциональную оплату токенов столкнулся с тем, что расходы на оплату услуг провайдеров ИИ в первый день выросли в семь раз. С этим явно нужно было что-то делать, и руководство компании стало два раза в неделю анализировать возможности сэкономить на использовании ИИ.

В целом, как отмечает Financial Times, тактика потребителей систем ИИ сводится как к ограничению использования сторонних инструментов, за которые надо платить, так и к поиску более дешёвых альтернатив. В некоторых случаях последними становятся либо разворачиваемые на собственной инфраструктуре ИИ-модели с открытым исходным кодом, либо более доступные системы тех же китайских разработчиков. В условиях удалённого доступа китайские решения могут быть дешевле хотя бы в силу более низких тарифов на электроэнергию в КНР. С начала этого года китайские ИИ-модели обошли американских по объёму потребления токенов.

Некоторые представители бизнеса ввели лимиты расходов на использование стороннего ИИ своими сотрудниками. Например, в Uber данная сумма ограничена $1500 на одного сотрудника в месяц. Расходы выросли по мере перехода пользователей от простого взаимодействия с чат-ботами к применению множественных ИИ-агентов. На одного человека в организации могут приходиться от 10 до 10 000 агентов, и все они непрерывно потребляют токены, за которые нужно платить. Аналитики Goldman Sachs ожидают, что к 2030 году потребление ИИ-токенов вырастет в 24 раза, и это само по себе усугубит дефицит чипов в ближайшие полтора года.

Даже располагающие собственной вычислительной инфраструктурой компании типа Amazon (AWS) начали следить за эффективностью использования ресурсов. Этот облачный гигант начал бороться с фиктивной демонстрацией бурной ИИ-деятельности некоторыми сотрудниками, которые рассчитывали продемонстрировать руководству лояльность идее всеобщего погружения в такую активность. Meta✴ пришлось последовать примеру конкурента в апреле этого года. В любом случае, даже Amazon и Meta✴ зависят от сторонних провайдеров типа Anthropic, за услуги которых надо платить по коммерческим ставкам.

Microsoft начала предлагать стремящимся к оптимизации затрат на ИИ клиентам новую услугу, позволяющую оптимальным образом выбирать используемые средства. Если для решения поставленной задачи достаточно ограничиться применением более дешёвой модели, то она поручается именно ей, а не отправляется по наиболее дорогому для клиента маршруту. Иногда при ручной маршрутизации запросов компании предпочитают использовать более старые и дешёвые ИИ-модели, не гонясь за самыми прогрессивными. При всём этом внутри компаний всегда находятся пользователи, которым не хватает вычислительных ресурсов для решения своих задач. Публичным компаниям становится сложнее оправдывать растущие расходы на ИИ перед акционерами и инвесторами.

Google DeepMind выработала линию защиты от собственных ИИ-агентов

В Google разработали план по сохранению контроля над агентами искусственного интеллекта, которые, постоянно совершенствуясь, используются внутри компании. Чтобы помочь другим лабораториям ИИ, в Google опубликовали дорожную карту, в которой изложено поэтапное внедрение мер защиты от этой угрозы.

 Источник изображений: deepmind.google

Источник изображений: deepmind.google

Разработанный в подразделении Google DeepMind план безопасности предполагает отход от типичного для сообщества подхода, направленного на решение «проблемы согласования» — идее определения того, как обучить систему ИИ таким образом, чтобы её действия соответствовали намерениям, ценностям и этике управляющих ею людей. В Google не спорят, что согласование остаётся одним из основных элементов безопасности, но составители дорожной карты исходят из того, что эта проблема, возможно, никогда не будет решена в полной мере. Поэтому формируется многоуровневая система безопасности, в которой ИИ-агенты рассматриваются как вероятная угроза внутри организации.

Механизмы защиты от собственных ИИ-агентов во многом позаимствованы у традиционных служб безопасности, которые занимаются угрозой со стороны собственных сотрудников компаний — и адаптированы к новым условиям, потому что «ИИ системно отличается от людей». ИИ-агенты способны действовать быстрее и в большем масштабе, чем отдельный недобросовестный сотрудник, поэтому необходимы системы, способные контролировать доступ ИИ-агентов к определённым инструментам; а также системы, способные выявлять у них аномальное поведение. Существующие системы контроля доступа ориентированы на должность и полномочия конкретного сотрудника компании; некоторые поставщики систем массового управления ИИ-агентами исходят из того, что они должны иметь те же доступ и разрешения, что и сотрудники, от имени которых они работают.

Этот подход в Google считают бесперспективным. По мере автоматизации рабочих процессов становится всё менее очевидно, от чьего имени работает ИИ-агент, и в полностью автоматизированной среде один ИИ-агент способен выполнять задачи, связанные с различными должностями, а не только с одной. Наконец, в интересах организации один ИИ-агент может выполнять задачи и в разных рабочих процессах. Поэтому необходима динамичная система контроля доступа, которая может меняться в зависимости от выполняемой задачи и от того, как эта задача вписывается в рабочий процесс. Допустимы сценарии, когда один и тот же ИИ-агент сначала имеет разрешение на выполнение конкретного действия или доступ к определённой базе данных, а через несколько минут в рамках другого рабочего процесса ему отказывается в тех же привилегиях. Необходима система мониторинга в реальном времени, которая знает, каким должно быть поведение ИИ-агента при выполнении любой задачи в любом рабочем процессе, и если выявляется отклонение, и он пытается сделать что-то, чего, как подозревает система, делать не должен, она оперативно реагирует.

В распоряжении Google DeepMind уже разработан внутренний прототип системы, который асинхронно отслеживает траектории работы агентов-программистов и направляет подозрительные сигналы на рассмотрение человеку. Эта система уже проанализировала около 1 млн задач этих агентов; работа «сыграла решающую роль в создании системы мониторинга в реальном времени для агента Gemini Spark» и помогла реагировать на такие проблемы как непреднамеренное удаление данных. Большинство попавших в поле зрения мониторов событий не носят злонамеренного характера — чаще всего это результат «неправильной интерпретации [задачи] агентом или чрезмерного стремления достичь поставленной пользователем цели».

Мониторинг в реальном времени — лишь один из 15 способов снижения риска, которые перечислены в дорожной карте Google DeepMind. Предлагаются также журналы сетевой активности, которые изучаются в реальном времени или проверяются позже; подключение несложной, но заслуживающей доверия модели ИИ, которая осуществляет мониторинг «траектории рассуждений» — она, впрочем не всегда точно отражает, что агент в действительности «думает»; и даже отслеживание механизмов активации цифровых нейронов в нейросети, помогающее выявлять признаки того, что модель действует обманным путём — аналог МРТ в реальном времени.

На основе дорожной карты разрабатывается структура под названием TRAIT&R (таксономия вредоносных тактик и алгоритмов ИИ), во многом основанная на ATT&CK — базе знаний о недружественном поведении в области кибербезопасности, поддерживаемой организацией MITRE. Таксономия выделяет три категории угроз, от которых в Google DeepMind выстраивают защиту: «утеря контроля», при которой модель развёртывает скрытые неконтролируемые инструменты; «саботаж работы» (незаметное ухудшение ИИ-агентами согласованности в области безопасности); и «прямой вред» (утечка весов модели или уничтожение критически важных активов).

Компания, по её признанию, уже значительно продвинулась в реализации дорожной карты — что-то только разрабатывается, а что-то уже внедряется. В перспективе эти средства безопасности Google DeepMind намерена включить в систему Frontier Safety Framework.

Microsoft подключит DeepSeek к Copilot Cowork в качестве экономичной альтернативы OpenAI и Anthropic

Microsoft планирует перевести Copilot Cowork на оплату по факту использования вычислительных ресурсов и одновременно рассматривает возможность подключить модель DeepSeek в качестве более дешёвой альтернативы для своих корпоративных клиентов, сообщает Axios.

 Источник изображения: Rubaitul Azad/unsplash.com

Источник изображения: Rubaitul Azad/unsplash.com

Рост популярности агентских инструментов, включая Copilot Cowork, Anthropic Claude Code и OpenAI Codex, сопровождается многократным увеличением числа запросов к ИИ-моделям в ходе выполнения задач, что порождает непредсказуемо высокие счета для клиентов в корпоративном сегменте и одновременно увеличивает нагрузку на вычислительные ресурсы. Данная проблема побудила Microsoft пересмотреть подход к ценообразованию, поскольку безлимитные тарифы оказались экономически невыгодными при интенсивной эксплуатации моделей.

Компания уже проводит тестирование доработанной версии DeepSeek V4, а также изучает другие открытые модели, стремясь предложить заказчикам альтернативу OpenAI и Anthropic. Ожидается, что окончательное решение о выборе конкретной модели будет объявлено в течение нескольких недель.

В случае утверждения DeepSeek эта модель будет полностью развёрнута на инфраструктуре Azure, благодаря чему все данные останутся в облаке корпорации с сохранением стандартных механизмов безопасности, соответствуя требованиям и контролю за местонахождением информации. Инженеры Microsoft уже провели тонкую настройку модели и внедрили дополнительные защитные фильтры.

Вице-президент Чарльз Ламанна (Charles Lamanna) также пояснил, что тестирования показали невозможность сохранения безлимитного доступа, поскольку сотни задач в неделю от одного пользователя, хотя и свидетельствуют о высокой эффективности модели, ведут к чрезмерным издержкам.

Qualcomm готовится к миру без приложений и разрабатывает более 40 ИИ-устройств

Из интервью генерального директора Qualcomm Криштиано Амона (Cristiano Amon) ресурсу CNBC становится понятно, что он убеждён в способности ИИ-агентов изменить не только сферу аппаратного, но и программного обеспечения. Компания сейчас работает над дизайном примерно 40 персональных устройств, которые опираются на локальную работу с ИИ.

 Источник изображения: Qualcomm Technologies

Источник изображения: Qualcomm Technologies

«Считаю, что на рынке будет много экспериментов с различными формфакторами. Сейчас мы разрабатываем свыше 40 вариантов дизайна для таких устройств, и поверьте мне, они обладают очень широким спектром формфакторов», — пояснил генеральный директор Qualcomm. Помимо уже привычных умных часов, на рынке могут появиться наушники с камерами, ювелирные украшения со встроенной электронной начинкой и даже булавки. Любой предмет, который всегда находится с человеком, может использоваться для доступа к ИИ-агенту.

Агент может моментально предоставлять расшифровку банковских транзакций, лишая пользователя необходимости вручную просматривать выписку в поисках нужной информации. Сам метод взаимодействия пользователя с приложениями изменится, на переднем крае в этой цепочке окажутся агенты. Как и нынешние смартфоны, по мнению Амона, будущие типы ИИ-устройств сформируются вокруг агентов. Смартфоны полностью не исчезнут, но их будут дополнять многие другие виды устройств, позволяющие человеку взаимодействовать с ИИ. Сейчас, по его словам, умные очки поставляются десятками миллионов штук в год. Через пару лет тиражи будут измеряться сотнями миллионов очков в год, а со временем они смогут догнать по популярности и смартфоны. В прошлом году последних по всему миру было продано 1,26 млрд штук.

По словам Амона, на рынок ИИ-устройств выйдут новые крупные игроки, включая компании, занимающиеся разработкой ИИ-агентов. Тем более, что сбор данных через собственные устройства позволит разработчикам ИИ постоянно совершенствовать свои программные продукты. Поскольку устройства для работы с ИИ-агентами будут становиться всё более компактными, чипы для них тоже должны измениться. Они вынуждены будут повышать энергетическую эффективность, помимо прочего. Как резюмировал глава Qualcomm, «ни одно из имеющихся сегодня устройств не готово к будущему».

Google начала развёртывать поисковых ИИ-агентов — но пока лишь для платных пользователей

На майской конференции Google рассказала о новой технологии — способных работать в фоновом режиме поисковых агентах с искусственным интеллектом. Теперь компания начала развёртывать эту функцию, но пока воспользоваться ею могут только подписчики тарифа Google AI Ultra.

 Источник изображения: blog.google

Источник изображения: blog.google

Поисковые агенты круглосуточно работают в фоновом режиме и «интеллектуально анализируют информацию, чтобы найти то, что вам нужно, в нужный момент». Одним из их видов являются информационные агенты — они помогают пользователям «оставаться в курсе всего, что для них наиболее важно». Они ищут информацию по блогам, новостным сайтам, в сообщениях соцсетей; а также в реальном времени осуществляют мониторинг данных в области финансов, шопинга и спорта, «отслеживая изменения, связанные с вашим конкретным вопросом».

На выходе пользователь получает «синтезированное обновление [данных] с возможностью принимать меры». В одном из примеров он перечисляет требования к жилплощади, и агент предлагает ему уведомления о выходе соответствующих требованиям новых объявлений. В основном приложении Gemini такие функции могут автоматически запускаться только раз в день; ИИ-агенты Gemini Spark запускаются каждые 15 минут, а поисковые агенты действуют более оперативно.

Воспользоваться новой функцией могут пока только подписчики тарифов Google AI Ultra стоимостью $99,99 или $199,99 в месяц. Для её запуска достаточно открыть «Режим ИИ» и добавить в запрос «держи меня в курсе» или «оповести меня, когда». Функция доступна на всех языках и рынках, где работает «Режим ИИ». До конца лета аудитория расширится и на подписчиков Google AI Pro.

Три четверти пользователей ИИ уже доверяют ИИ-агентам больше, чем друзьям

Трое из четверых (74 %) потребителей заявили, что доверяют персональному агенту искусственного интеллекта больше, чем своему лучшему другу, когда тот совершает покупку от его имени, сообщает TechRadar со ссылкой на проведённый компанией Accenture опрос.

 Источник изображения: Igor Omilaev / unsplash.com

Источник изображения: Igor Omilaev / unsplash.com

В опросе приняли участие более 25 000 потребителей из 16 стран мира. ИИ используется для сравнения, ведения переговоров, принятия решений и даже совершения покупок от имени своих пользователей. Ещё 74 % опрошенных заявили, что теперь готовы разрешать ИИ-агентам выполнять связанные с коммерцией задачи: совершать сделки, рассматривать жалобы от клиентов, изменять порядок заказа продуктов и продлевать подписки.

Большинство потребителей высказалось за то, чтобы контролировать ситуацию и оставлять последнее слово за собой, но уже каждый третий (32 %) готов дать ИИ возможность принимать окончательное решение о покупке перед оплатой с учётом заранее определённых параметров: бюджета, отношения к торговой марке и других предпочтений. И каждый десятый (9 %) разрешил бы ИИ-агентам совершать транзакции и совершать покупки автономно, без их одобрения.

Ещё 31 % признались, что успешная сделка с низким уровнем риска, такая как покупка продуктов или пересмотр заказа товаров для дома, способна повысить их доверие к ИИ-агентам. Компьютеры всё активнее берут на себя задачи, связанные с покупкой товаров, но и от физических магазинов люди пока отказываться не готовы: без малого треть (31 %) считает, что значение магазинов как места для обмена опытом возрастёт, а 30 % указывают, что для укрепления доверия важное значение сохранит личное общение. Другими словами, потребитель хочет, чтобы процесс покупки стал проще, но и от привычных форматов он отказываться не намерен — такой вывод авторы исследования предлагают сделать розничным продавцам.

Google намерена узнать, что произойдёт, когда миллионы ИИ-агентов начнут действовать вместе

Специализирующееся на изучении и разработке систем искусственного интеллекта подразделение Google DeepMind объявило в выделении финансирования в размере $10 млн на изучение сценариев, при которых несколько миллионов ИИ-агентов начинают взаимодействовать друг с другом. В проекте согласились принять участие несколько частных и государственных организаций со всего мира.

 Источник изображения: deepmind.google

Источник изображения: deepmind.google

Всего через несколько месяцев во всём мире ИИ-агенту будут развёрнуты в таких масштабах, что сопутствующие риски станут реальной проблемой, и учёные хотят опередить этот момент. Потенциальные угрозы сводятся к усиленным вариантам неблагоприятных сценариев, которые наблюдаются уже сегодня: мошеннические схемы, инъекции в запросах, которые превращают ИИ-агентов в самонаводящееся вредоносное ПО, и другие формы кибератак. Единственный способ понять, что может произойти, когда большое количество многоагентных систем будет взаимодействовать друг с другом — провести реалистичные симуляции: поместить ИИ-агентов в «песочницы» и наблюдать за их поведением.

Не получится предсказать, что произойдёт, если изучать отдельных агентов или даже нескольких агентов изолированно. И нельзя предполагать, что выполняющие инструкции больших языковых моделей ИИ-агенты будут действовать рационально — сложность возникает в условиях огромного числа одновременных взаимодействий. Есть версия, которую не исключают и в Google DeepMind, что сильный ИИ (AGI) возникнет не из одной сверхумной модели, а станет порождением своего рода коллективного разума ИИ-агентов, где возможности группы оказываются сильнее, чем суммы её частей.

Google DeepMind — не единственный крупный разработчик, предупреждающий об угрозах, исходящих от технологий, которые он создаёт. Ранее Anthropic опубликовала рекомендации по развёртыванию ИИ-агентов, основанные на принципе «нулевого доверия»: следует исходить из того, что компьютерная система уязвима, агент является злоумышленником, и взлом неизбежен. Ранее подходы к обеспечению кибербезопасности имели в основе предположение, что объект, от которого исходит угроза — это написанное человеком ПО, выполняющее фиксированные действия по фиксированным траекториям, указывают эксперты. ИИ-агент действует иначе: он рассуждает, импровизирует, и его можно взломать всего одной фразой в документе, который ему предлагается прочитать. В рамках проекта важно не упускать из виду не только экзотические гипотетические сценарии, но и скучные проблемы, которые уже существуют.

Криптобиржа Coinbase допустила ИИ-агентов к торговле и аналитике

Криптовалютная биржа Coinbase представила инструмент, позволяющий ИИ-агентам самостоятельно совершать сделки от лица пользователей и оплачивать без авторизации премиум-аналитику. Инструмент использует открытый платёжный протокол x402, разработанный совместно с AWS, Anthropic, Circle и Near, который обеспечивает агентам доступ к API и вычислительным ресурсам.

 Источник изображения: Coinstash Australia/Unsplash

Источник изображения: Coinstash Australia/Unsplash

Запуск функции состоялся на фоне глобального роста автоматизированного интернет-трафика и спустя несколько дней после анонса аналогичного инструмента американской торговой платформой Robinhood. Пользователи могут интегрировать агента со своим основным торговым счётом или настроить его работу в изолированной среде sandbox (песочница) для ограничения доступа к основным средствам. Искусственный интеллект поддерживает взаимодействие с платформой Coinbase Advanced, предназначенной для профессиональных трейдеров, которая включает расширенные аналитические инструменты и графики TradingView. Это позволит ботам проводить технический анализ и исполнять сделки на основе полученных данных.

На текущем этапе функциональность движка ограничена торговлей на спотовых рынках криптовалют и деривативами, однако в будущем компания планирует добавить торговлю акциями и доступ к рынку предсказаний (prediction markets). Трейдеры смогут поручать агенту ребалансировку портфеля, следование инвестиционной стратегии или получение рекомендаций по разовым сделкам.

Как пояснил изданию TechCrunch руководитель ИИ-подразделения Линкольн Мюрр (Lincoln Murr), главное отличие их разработки от классических брокерских инструментов заключается в объединении биржевого доступа с нативным платёжным протоколом, обеспечивающим бесшовную обработку транзакций, основная часть которых будет осуществляться через ботов. Инструмент совместим с нейросетями компаний OpenAI и Anthropic посредством MCP-сервера.

Тенденция к развитию автономных платежей прослеживается и у других крупных игроков рынка. Например, в прошлом месяце Visa инвестировала в стартап Replit, а на этой неделе заключила партнёрство с OpenAI для изучения профильных технологий. Одновременно ускорение темпов внедрения ИИ-агентов в финансовую сферу уже привлекло внимание мировых регуляторов. В частности, Совет по финансовой стабильности (FSB) заявил о необходимости создания строгих механизмов контроля для минимизации сопутствующих рисков.

ИИ-агент OpenClaw провалил тесты на фишинговые атаки

Исследователи в области кибербезопасности протестировали почтовый агент искусственного интеллекта OpenClaw, чтобы выяснить, настолько ли он наивен, чтобы попадаться на те же фишинговые уловки, что и обычные офисные сотрудники. Приложение «успешно» провалило эти тесты.

 Источник изображения: varonis.com

Источник изображения: varonis.com

Исследователи в области кибербезопасности из компании Varonis запустили в приложении OpenClaw ИИ-агента по имени Pinchy. Его подключили к почтовому ящику Gmail, к браузеру и к API Google Workspace. Соответствующую учётную запись они наполнили данными вымышленной компании, учётными данными AWS, базы данных, файлами экспорта CRM, внутренней перепиской и приглашениями календаря, после чего поставили Pinchy задачу отслеживать и обрабатывать входящие письма.

Чтобы имитировать реальную обстановку, они создали две конфигурации: общую со стандартными рабочими инструкциями и строгий режим, предупредив ИИ об угрозе фишинга и других мошеннических схем по электронной почте. Когда якобы злоумышленник выдал себя за руководителя отдела и запросил доступ к тестовой среде, Pinchy предоставил его. Когда злоумышленник запросил экспорт данных клиента, утверждая, что в удалённом режиме работает над презентацией, Pinchy выполнил и этот запрос.

Но когда ИИ-агенту отправили фишинговое письмо с подарочной картой и ссылкой, система определила страницу как вредоносную и заблокировала её. Отклонил он и попытку внедрить вредоносное приложение для взлома Google OAuth под видом платформы для учёта рабочего времени. Таким образом, ИИ хорошо распознаёт подозрительные URL-адреса и вредоносные приложения, но позволяет себя обмануть, когда требуется проверка личности или широкий контекст.

Эксперты Varonis раскритиковали Google за то, что Gemini показал «большую готовность к взаимодействию», а OpenAI GPT оказался более осторожен. Исследователи призвали разработчиков улучшить средства проверки личности у ИИ-агентов.

Успевший поработать в xAI, OpenAI и Google Игорь Бабушкин основал собственный ИИ-стартап

Один из основателей xAI Игорь Бабушкин, который покинул его в 2025 году, чтобы заняться собственными венчурными проектами, на этой неделе объявил о создании стартапа River AI, который сосредоточится на создании «персонализированного ИИ». До основания xAI этот учёный российского происхождения успел поработать в OpenAI и Google DeepMind.

 Источник изображения: Unsplash, Мария Шалабаева

Источник изображения: Unsplash, Мария Шалабаева

С прежним местом работы Игоря Бабушкина команду нового стартапа роднят и другие выходцы как из xAI, так и из компании Tesla, которая тоже занимается разработкой систем ИИ применительно к автопилоту. По словам самого Бабушкина, новая компания будет заниматься созданием ИИ-агентов, которые будут обучаться пользователями и контролироваться ими же. Создаваемые River AI агенты будут учитывать стиль, предпочтения и цели конкретного пользователя, а также работать так, как если бы человек контролировал их всё время.

С момента вхождения xAI в состав SpaceX первую из компаний успели покинуть десятки специалистов, включая почти всех сооснователей, которые стояли у истоков данного стартапа в 2023 году. Готовясь к IPO объединённой компании, Илон Маск (Elon Musk) пообещал серьёзным образом реструктурировать xAI. Прочие выходцы из xAI тоже были замечены в создании новых компаний в данной сфере. Например, Эрик Зеликман (Eric Zelikman) и Ючэнь Хэ (Yuchen He) участвовали в создании компании Humans&. По словам Бабушкина, к основанию стартапа River AI его подтолкнули растущие в обществе рассуждения об угрозе вытеснения человека искусственным интеллектом с рынка труда. По его мнению, ИИ можно использовать таким образом, чтобы он не заменял, а дополнял человека. Помимо программного интерфейса, позволяющего создавать пользовательских ИИ-агентов, этот стартап вынашивает планы по выходу на рынок «физического ИИ» с аппаратными разработками. Вместе с Бабушкиным стартап River AI основали братья Соболевы, которые занимали должности инженеров в xAI, а также Винсент Старк (Vincent Stark) и Лили Лим (Lily Lim). Два последних сооснователя River AI в xAI занимались безопасностью продуктов и юридическими вопросами соответственно.

Xiaomi представила ИИ-агента для программирования MiMo Code — он хорошо помнит, что делает

Xiaomi открыла исходный код проекта MiMo Code V0.1.0 — основанного на искусственном интеллекте помощника для написания кода, который предлагает решение одной из важнейших проблем: большинство ИИ-агентов быстро теряют контекст.

 Источник изображения: mimo.xiaomi.com

Источник изображения: mimo.xiaomi.com

Решение основано на открытом проекте OpenCode и распространяется под демократичной лицензией MIT. В базовой комплектации приложение предлагает бесплатный доступ к мультимодальной модели Xiaomi MiMo-V2.5, но её можно заменить сторонними решениями, в том числе DeepSeek, Kimi и GLM. Важнейшим достоинством MiMo Code является система постоянной памяти. Большинство ИИ-помощников программиста полностью зависят от контекстного окна модели — как только оно заполняется, агент начинает забывать предыдущие решения и диалоги.

В MiMo Code задачу решили при помощи фонового субагента: когда активный диалог приближается к пределу, субагент автоматически сжимает всё в структурированную сводку, позволяя основному агенту продолжать работу в том же контексте. Каждые семь дней запускается дополнительная функция «/dream» — обслуживающий агент проверяет все старые сессии и файлы памяти, удаляет дубликаты, проверяет пути к файлам и производит сжатие обновлённого хранилища долговременной памяти.

В MiMo Code также входит система Harness, разработанная специально для моделей MiMo — фреймворк разработан для использования базовых возможностей модели, не ограничивая ИИ одной только функцией конечной точки API. Система работает совместно с режимом Compose, который активируется по нажатии клавиши Tab. Вместо того, чтобы просить выполнять ИИ по шагу за раз, можно задать ему конечную цель, и агент попытается сформировать весь рабочий процесс: планирование, проектирование, написание кода, тестирование и проверку.

Такой подход, по утверждению Xiaomi, позволяет получить на выходе «готовый продукт промышленного уровня». MiMo Code набрал 62 % в тесте SWE-Bench Pro и 72 % — в Terminal Bench 2, на 5 п.п. обогнав Claude Code с той же базовой моделью. ИИ-агент поддерживает даже голосовой ввод — за него отвечает модель MiMo-V2.5-ASR. Xiaomi MiMo Code на Apple macOS и Linux устанавливается через терминал, а для работы на Windows установка осуществляется через npm. Подключение к MiMo-V2.5 производится без регистрации.

Еврокомиссия требует от Meta✴ восстановить доступ конкурирующих ИИ-агентов к WhatsApp

В декабре прошлого года власти Евросоюза начали антимонопольное расследование в отношении компании Meta✴ Platforms, которая, по их мнению, предоставляла собственным ИИ-сервисам при работе через WhatsApp необоснованное преимущество по сравнению со сторонними. Теперь Еврокомиссия требует восстановить доступ сторонних ИИ-сервисов в WhatsApp.

 Источник изображения: Unsplash, 𝕡𝕒𝕨𝕤 𝕒𝕟𝕕 𝕡𝕣𝕚𝕟𝕥𝕤

Источник изображения: Unsplash, 𝕡𝕒𝕨𝕤 𝕒𝕟𝕕 𝕡𝕣𝕚𝕟𝕥𝕤

По мнению европейских чиновников, данный шаг направлен на поддержание условий здоровой конкуренции на период проведения антимонопольного расследования, которое, исходя из имеющейся практики, может затянуться надолго. «На быстро развивающихся рынках конкуренция может быть проиграна задолго до принятия окончательного вердикта», — заявила еврокомиссар по конкуренции Тереза Рибера (Teresa Ribera), на слова которой ссылается Financial Times. По мнению регулятора, у жителей Европы должен быть выбор среди ИИ-ассистентов, которые они готовы использовать в связке с WhatsApp, и «никто не имеет права принимать это решение за них».

Данные меры со стороны европейских регуляторов накладываются на выход Meta✴ в корпоративный сегмент ИИ-решений. Компании могут использовать свою учётную запись в мессенджере WhatsApp для автоматизации общения с клиентами, используя ИИ-агенты. За доступ к такой возможности корпоративные пользователи WhatsApp должны платить, поэтому инициатива властей ЕС вызывает у представителей Meta✴ справедливое раздражение. Формально, конкуренты типа OpenAI получают возможность использования платного сервиса WhatsApp Business на безвозмездной основе для продвижения собственных решений, как отмечается в заявлении Meta✴, и подобный «регуляторный перегиб» компания готова оспаривать в суде.

Apple Intelligence сможет самостоятельно исправлять скомпрометированные пароли

Apple анонсировала новую функцию в приложении Passwords, которая позволяет автоматически заменять слабые и скомпрометированные пароли. Технология использует Apple Intelligence и браузер Safari для выполнения действий от лица пользователя. Функция расширяет существующую возможность приложения по обнаружению ненадёжных или раскрытых учётных данных, сообщает MacRumors.

 Источник изображения: macrumors.com

Источник изображения: macrumors.com

Ранее Passwords только предупреждал о проблемах с данными, но для их исправления требовалось вручную переходить на каждый сайт и менять пароль. Новая система полностью автоматизирует этот процесс и работает по принципу агента, который осуществляет навигацию по веб-сайтам, выполняет вход в аккаунты и обновляет учётные записи для входа без необходимости вмешательства пользователя (после первоначального подтверждения). В момент выполнения операции статус процесса отображается в виде активности в реальном времени (Live Activity) на экране устройства.

Внедрение этой возможности направлено на устранение барьеров при поддержании «цифровой гигиены» и повышение общего уровня безопасности пользовательских данных, а автоматизация рутинных процедур позволяет сократить время, необходимое для реагирования на утечки конфиденциальной информации или использование ненадёжных комбинаций символов. Техническая реализация обеспечивает бесшовное взаимодействие между iOS и веб-интерфейсами сторонних ресурсов.


window-new
Soft
Hard
Тренды 🔥
Популярность Anthropic Cluade среди платных пользователей растёт, но лидером по-прежнему является OpenAI ChatGPT 3 ч.
«Яндекс» сделал «Алису AI» более человечной — она запоминает пользователей и подстраивается под их стиль общения 9 ч.
Несколько лет разочарований с Destiny 2 обернулись для Bungie массовыми увольнениями, но разработчики «должны гордиться» собой 12 ч.
ИИ-модель Wildberries вошла в топ-3 русскоязычного бенчмарка MERA 12 ч.
Adobe купила разработчика ИИ для повышения качества изображений и видео Topaz Labs 12 ч.
Глава Epic Games раскритиковал Valve за «очень безответственную» политику Steam в отношении генеративного ИИ 13 ч.
Ролевой боевик Enshrouded с выживанием в волшебном мире и кооперативом на 16 человек скоро выйдет из раннего доступа — дата релиза и новый трейлер 13 ч.
Московский суд оштрафовал Apple на 500 000 рублей, но дело не в удалении VK 14 ч.
Инженерные профессии оказались наиболее устойчивы в эпоху ИИ 14 ч.
Google продолжает терять ИИ-таланты — ещё двое исследователей ушли в Anthropic 14 ч.
Apple ускорит выход флагманских процессоров M7, которые предложат передовые функции ИИ 2 ч.
Новая статья: Обзор робота-уборщика Midea VCR V15 MAX ULTRA: не разменивайся на мелочи (но не переплачивай) 7 ч.
Apple явно намекнула, что сегодняшнее повышение цен — это только начало 7 ч.
Xbox Series X и S снова подорожают по всему миру — теперь сразу на $100–150 9 ч.
Планшет Honor MagicPad 4 с большим OLED-экраном и Snapdragon 8 Gen 5 поступил в продажу в России за 100 тыс. рублей 11 ч.
Акции Apple упали более чем на 5 % после резкого повышения цен на MacBook и iPad 11 ч.
Эволюция гольф-кара: выходцы из Apple и Audi создали электрический багги для дорог общего пользования за $25 000 12 ч.
Leica выпустила 44-Мп полнокадровую камеру SL3-P за $6690 — она займёт нишу между SL3 и SL3-S 12 ч.
«Звёздный разум» заполнит орбиту: SpaceX назвала будущую миллионную группировку ИИ-спутников Starmind 14 ч.
Apple подняла цены на все Mac и iPad на $100–1300 — причина та же, что и у всех 14 ч.