Сегодня 24 декабря 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → агенты
Быстрый переход

Anthropic сделала базовые навыки ИИ-агентов открытым стандартом

Anthropic намеревается сделать открытым стандартом Agent Skills — набор навыков агентов искусственного интеллекта. В компании надеются, что это решение станет стандартом для всей отрасли ИИ.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Anthropic уже опубликовала открытую спецификацию и образец SDK на сайте Agent Skills, а Microsoft начала интеграцию этих решений в VS Code и GitHub. Разработчики прочих средств написания кода при помощи ИИ, в том числе Cursor, Goose, Amp и OpenCode, используют некоторые наработки Anthropic в своих сервисах — компания ведёт активные переговоры с другими участниками экосистемы.

Пакет Anthropic Skills представляет собой наборы инструкций, сценариев и ресурсов, которые позволяют ИИ последовательно выполнять специализированные задачи. Пользователям не приходится каждый раз готовить конкретные запросы, поэтому приложения ИИ-агентов становятся всё более популярными в областях программирования, права, финансов, бухгалтерского учёта и обработки данных.

«Отзывы положительные, потому что Skills позволяют им персонализировать Claude так, как они в действительности работают, и быстрее получать качественные результаты», — отметил менеджер по продукту Anthropic Махеш Мураг (Mahesh Murag). Среди наработок компании уже значится открытый стандарт Model Context Protocol (MCP), позволяющий подключать ИИ-помощников к сторонним инструментам, сервисам и источникам данных. Anthropic позиционирует себя не только как разработчика моделей и средств ИИ, но и архитектора на инфраструктурном уровне, чьи открытые продукты пронизывают всю отрасль, затрагивая работу конкурентов, в том числе OpenAI и Google.

OpenAI признала: у ИИ-браузеров есть уязвимость к инъекциям, которую невозможно полностью устранить

OpenAI стремится усилить безопасность своего браузера с искусственным интеллектом Atlas, но в компании поняли, что полностью исключить угрозу внедрения запросов (prompt injections) не получится. Внедрением запросов называется тип атаки, при котором агент ИИ выполняет скрытые инструкции в невидимых областях веб-страниц или писем электронной почты.

 Источник изображения: Dima Solomin / unsplash.com

Источник изображения: Dima Solomin / unsplash.com

Атаки с внедрением запросов едва ли получится изжить полностью так же, как мошеннические схемы и методы социальной инженерии, считают в OpenAI, а «режим агента» в браузере «расширяет поверхность угроз безопасности». OpenAI выпустила Atlas в октябре, и вскоре исследователи в области кибербезопасности начали демонстрировать, что поведением браузера можно манипулировать, например, написав несколько слов в Google Docs. Разработчики Brave подтвердили, что непрямое внедрение запросов представляет собой системную проблему для ИИ-браузеров, в том числе для Perplexity Comet. О невозможности полностью исключить подобные атаки недавно заявили в Национальном центре кибербезопасности Великобритании и порекомендовали экспертам не пытаться их «остановить», а смягчить возможные последствия. А Google и Anthropic решили сделать ставку на многоуровневую защиту и постоянное стресс-тестирование систем.

В OpenAI решили пойти своим путём и создали «автоматизированного злоумышленника на основе большой языковой модели». Это бот, который прошёл обучение с подкреплением и принял на себя роль хакера, постоянно пытающегося незаметно отправить ИИ-агенту вредоносные инструкции. Бот тестирует свои атаки в симуляциях, демонстрируя, как в тех или иных условиях рассуждает и действует целевой ИИ. Он изучает реакцию, корректирует схему атаки и повторяет свои попытки снова и снова. У посторонних доступ к настолько глубокому пониманию механизмов внутреннего мышления целевого ИИ отсутствует, поэтому в теории бот OpenAI должен находить уязвимости быстрее, чем реальные злоумышленники.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

В одной из демонстраций бот подбросил в почтовый ящик пользователя «отравленное» электронное письмо. ИИ просканировал корреспонденцию, открыл это письмо, проследовал скрытым в нём инструкциям и отправил от имени пользователя заявление об увольнении вместо автоматического ответа о его отсутствии на рабочем месте. После обновления безопасности ИИ-агент, однако, успешно обнаружил попытку внедрения запроса и сообщил о ней пользователю. Если надёжной и полной защиты от таких атак не существует, отметили в компании, то приходится полагаться на масштабное тестирование и ускорять циклы обновления. О фактических успехах по сокращению числа реакций на внедрения запросов в OpenAI не сообщили, но отметили, что работа в этом направлении при участии сторонних специалистов началась ещё до выхода Atlas.

Угроза от ИИ-агентов может быть серьёзной: они обладают некоторой автономностью при наличии высокого уровня доступа, указывают опрошенные TechCrunch эксперты. Поэтому одних только методов обучения с подкреплением недостаточно — необходимо учитывать и указанные аспекты: ограничивать действия, которые ИИ-агент способен осуществлять от имени учётной записи пользователя, в которую произведён вход, а также запрашивать подтверждения перед тем, как сделать нечто важное. На эти аспекты указывают и рекомендации OpenAI для пользователей: Atlas запрашивает подтверждение перед отправкой сообщений или перед совершением платежей. Пользователям также рекомендовали давать ИИ-агентам конкретные инструкции, а не, например, открывать доступ к почте и разрешать «делать, всё что потребуется». «Даже при наличии мер защиты широкая свобода действий облегчает скрытому или вредоносному контенту воздействие на агента», — предупредили в OpenAI.

ИИ ломает Microsoft изнутри: Наделла потребовал от менеджеров внедрять ИИ — или выметаться

Глава Microsoft Сатья Наделла (Satya Nadella) рассматривает ИИ как экзистенциальную угрозу, уникальную возможность и шанс закрепить за своей компанией место лидера в технологической индустрии. Для него эта миссия носит как личный, так и профессиональный характер, и он подталкивает компанию к переосмыслению методов работы на всех уровнях. Об этом свидетельствуют внутренние документы Microsoft, а также интервью с руководителями и сотрудниками компании.

Масштабные организационные изменения в Microsoft включают в себя громкие кадровые перестановки и требования к командам работать быстрее и эффективнее — все это направлено на консолидацию власти вокруг лидеров в области ИИ и радикальное изменение способов разработки и финансирования продуктов компании. По словам инсайдеров, Наделла оказывает давление на некоторых ветеранов Microsoft, предлагая им сделать выбор между масштабным внедрением ИИ и увольнением.

Недавно Наделла повысил Джадсона Альтхоффа (Judson Althoff), многолетнего руководителя отдела продаж, до должности генерального директора коммерческого подразделения Microsoft. Повышение Альтхоффа призвано дать Наделле и руководителям инженерного отдела компании больше времени для сосредоточения на технической работе, необходимой для реализации его амбиций в области ИИ. Во внутренней служебной записке этот шаг был назван «тектоническим сдвигом в развитии платформы ИИ».

 Источник изображений: Microsoft

Источник изображений: Microsoft

«Это также позволит нашим руководителям инженерного отдела и мне сосредоточиться на нашей самой амбициозной технической работе — в области строительства центров обработки данных, системной архитектуры, науки об ИИ и инноваций в продуктах — чтобы с интенсивностью и скоростью лидировать в этом поколении платформенного сдвига», — написал Наделла.

Один из руководителей Microsoft считает, что этот шаг, похоже, приносит свои плоды, предоставляя Наделле «дополнительные ресурсы для того, чтобы действительно руководить компанией в изучении, использовании и создании ИИ». По его словам, «Сатья на 100 % вовлечён в процесс обучения и внедрения ИИ в компании».

Согласно осведомлённым источникам, Наделла также лично проводит еженедельные «намеренно несколько хаотичные и неорганизованные» совещания по внедрению ИИ и курирует соответствующий канал в Teams, чтобы ускорить темпы работы и получить больше идей. Вместо руководителей на этих совещаниях предоставляют слово младшим техническим сотрудникам, что, по замыслу Наделлы, позволяет избежать директивного управления при внедрении ИИ.

В Microsoft намечаются и другие важные кадровые перестановки. По слухам, многолетний руководитель Office и Windows Раджеш Джа (Rajesh Jha) обдумывает возможность выхода на пенсию. Инсайдеры также говорят о возможности отставки Чарли Белла (Charlie Bell), возглавляющего отдел кибербезопасности Microsoft.

Надела недавно объявил в канале Teams, предназначенном для корпоративных вице-президентов Microsoft и выше, что компания находится на переломном этапе, по меньшей мере столь же значительном, как переход к облачным вычислениям, и ей необходимо полностью переосмыслить свою бизнес-модель. «Мы все должны работать и действовать как рядовые сотрудники в своих организациях, постоянно учась и разучиваясь», — написал он, имея в виду рядовых сотрудников, которые сосредоточены на технической работе, а не на управлении людьми.

«Я немного посмеиваюсь каждый раз, когда кто-то присылает мне сообщение о разговоре с другом из стартапа в области ИИ о том, как по-другому они работают, насколько они гибкие, сосредоточенные и быстрые, — добавил Наделла. — Реальность такова, что эта работа происходит прямо здесь, в Microsoft, у нас под носом! Наша задача как лидеров — искать это, поддерживать это, развивать это и учиться у наших собственных молодых талантов, которые заново изобретают новую производственную функцию!»

 Источник изображений: Microsoft

Президент по продуктам Microsoft CoreAI Аша Шарма (Asha Sharma), присоединившаяся к компании в 2024 году, рассказала, что за короткий период её работы компания кардинально изменила свою деятельность. Новая «производственная функция» Наделлы заключается в использовании ИИ для радикального изменения способов создания, разработки и предоставления продуктов и услуг.

В 2024 году индустрия ИИ выпускала новую масштабную базовую модель примерно каждые шесть месяцев. Затем релизы происходили каждые шесть недель. Сегодня ИИ меняется настолько быстро, что заставляет Microsoft переосмыслить не только свои продукты, но и весь способ создания программного обеспечения, отметила Шарма.

На протяжении десятилетий разработка программного обеспечения работала как конвейер, который преобразовывал набор входных данных — людей, время, ресурсы — в готовое ПО. Масштабирование производства требовало масштабирования этих входных данных. «ИИ разрывает эту связь», — уверена она.

По её мнению, теперь ИИ-агенты, данные и интеллект выступают в качестве нового типа масштабируемых единиц, способных генерировать программное обеспечение, аналитические выводы и принимать решения без соответствующего увеличения трудозатрат или бюджета на разработку. Это означает, что издержки на создание чего-то нового резко снижаются, объяснила Шарма, и команды теперь могут больше тратить на «суждение, вкус и решение проблем».

«Алиса AI» научилась исследовать и «торговаться» — «Яндекс» запустил режим «Исследовать» и агента «Найти дешевле»

Первым 100 тыс. пользователей, которые записались на получение раннего доступа к новым функциям «Алиса AI», компания «Яндекс» открыла доступ к агенту искусственного интеллекта «Найти дешевле», который помогает в поиске нужного товара по низкой цене, а также к режиму «Исследовать» — с ним ИИ изучает сложные предметные области, где присутствуют большие объёмы данных, требуются сложные расчёты и глубокое погружение в вопрос. Со временем «Яндекс» откроет доступ к новым функциям для всех записавшихся в список — они получат уведомление по электронной почте или в приложении «Алиса AI».

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Пользователь с доступом к ИИ-агенту «Найти дешевле» может отправить в переписку с чат-ботом ссылку на интересующий его товар и попросить найти его по более выгодной цене. Сервис изучит предложения от продавцов на их собственных сайтах и на торговых площадках и сформирует подборку самых выгодных вариантов. В некоторых случаях прямо в чате появится кнопка «Купить в 1 клик» с оплатой через «Яндекс Пэй» и заказом в пункт выдачи или курьером; иногда будет предлагаться и персональная скидка, доступная только в «Алисе AI». Помимо чат-бота, ИИ-агент может запускаться в «Яндекс Браузере» и поисковой службе, где появится кнопка «Найти скидку».

Режим «Исследовать» адресован пользователям, которым требуется глубокое изучение тех или иных вопросов — ИИ поможет, например, оптимизировать личный бюджет и накопить на автомобиль. Он учтёт величину дохода, регион, актуальные цены на машины и проценты по вкладам в банках. Пользователю достаточно сформулировать цель исследования для «Алисы AI», и та сделает всё самостоятельно: составит план исследования, отправит соответствующие теме поисковые запросы, проанализирует источники и скачает документы. При необходимости ИИ задаст пользователю дополнительные вопросы и уточнит задачу. По итогам исследования пользователь получит отчёт с планом, методикой, данными, выводами и рекомендациями. Если потребуются расчёты, «Алиса AI» самостоятельно напишет код для их проведения, выполнит его и покажет результаты.

В список ожидания доступа к ИИ-агенту «Найти дешевле» и режиму «Исследовать» записались более миллиона человек, и со временем «Яндекс» откроет доступ для всех них. В перспективе «Алиса AI» получит поддержку и других агентов: например, для записи в салон красоты или бронирования столика в ресторане на определённое время и место — с напоминаниями, а также возможностью отменить или перенести бронь. Появится также раздел «Моя память», в котором мысли и записи будут преобразовываться в списки дел и покупок, заметки и напоминания — можно будет на ходу наговаривать их ИИ, и тот всё зафиксирует и структурирует. Человеку больше не потребуется держать в голове большие объёмы задач.

ИИ-агенты научились оплачивать покупки картами Visa — тесты прошли успешно

Всё больше компаний электронной коммерции и финансовых организаций используют ИИ при оказании услуг потребителям. Сегодня Visa сообщила об успешном совершении сотен транзакций ИИ-агентами в рамках пилотной программы, запущенной после презентации в апреле инструмента для автоматизации покупок.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Visa, как и её конкуренты в финтех-индустрии, стремится к созданию инструментов, позволяющих потребителям поручать агентам искусственного интеллекта выполнение определённых транзакций. Искусственный интеллект трансформирует опыт онлайн-торговли для покупателей, меняя способы совершения покупок и поиска товаров.

Компания заявила, что планирует запустить пилотные программы в Азии и Европе в следующем году и сотрудничает с более чем 20 партнёрами по разработке инструментов для ИИ-агентов. «Этот год станет годом огромного распространения ИИ, и потребители начнут чувствовать себя комфортно в различных средах, созданных агентами», — уверен руководитель отдела развития продуктов и партнёрств Visa Рубайл Бирвадкер (Rubail Birwadker).

Visa не является пионером среди финансовых, торговых и кредитных компаний в применении ИИ-агентов. В апреле Mastercard сообщила о тестировании функции Agent Pay, которая позволяет ИИ-агентам совершать покупки онлайн от имени клиентов. В том же месяце Amazon начала тестирование услуги «Купи за меня», а PayPal и Perplexity объединили усилия для создания инструментов для ИИ-покупок.

По данным Visa, на декабрь 2025 года почти половина американских покупателей в той или иной мере используют ИИ при совершении покупок.

Google запустила ИИ-агента, который избавит от утренней проверки почты и календаря

Разработчики из Google хотят сделать так, чтобы люди по всему миру начинали свой день с взаимодействия с её искусственным интеллектом. Для этого поисковый гигант запустил экспериментального ИИ-агента, который будет анализировать электронные письма пользователей, календарь и документы, чтобы каждое утро отправлять в почту краткую сводку на основе проведённого анализа.

 Источник изображения: Google

Источник изображения: Google

Новая функция под названием CC каждое утро направляет в почтовый ящик пользователя ежедневную сводку под названием «Ваш день впереди». Это персонализированный отчёт, который Google описывает, как «одно чёткое резюме», в котором содержится расписание на предстоящий день, а также все ключевые задачи, которые следует выполнить, и важная информация, например, о счетах, которые нужно оплатить, или встречах, к которым следует подготовиться. CC также может подготавливать черновики писем и делать ссылки в календарь на случай, если пользователь хочет приступить к выполнению задач прямо в начале дня.

ИИ-агент CC запускается в раннем доступе для платных подписчиков старше 18 лет в США и Канаде. Google также объявила о запуске списка ожидания для получения доступа к CC, записаться в который могут все желающие пользователи, соответствующие упомянутым критериям. Компания не уточнила, как долго доступ к ИИ-агенту будет предоставляться в таком формате и когда его доступность будет расширена.

Основой для CC стала ИИ-модель Gemini, которая анализирует данные пользователя из почты Gmail, «Календаря» и Google Диска, а также собирает информацию в интернете. Пользователь может сделать ИИ-агента более персонализированным, рассказывая ему о себе и давая задания на запоминание данных, а также отвечая на предоставляемые сводки или общаясь с ним напрямую.

Nvidia выпустила ИИ-модель Nemotron 3 Nano 30B с открытыми весами и большущим контекстным окном

Компания Nvidia сообщила подробности о новом семействе моделей Nemotron 3 с открытыми весами, разработанном, в том числе, для создания специализированного агентного ИИ нового поколения.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Первый представитель семейства — модель Nemotron 3 Nano 30B с открытыми весами, общим количеством параметров в 30 млрд и 3 млрд активных параметров. Модель основана на гибридной архитектуре Mamba-Transformer, сочетающей «смесь экспертов» (MoE), обучение с подкреплением (RL) в интерактивных средах и собственное контекстное окно в 1 млн токенов, обеспечивающее высокопроизводительное и долгосрочное рассуждение для многоагентных приложений.

Как сообщает VideoCardz со ссылкой на публикацию на Hugging Face, маршрутизатор активирует 6 из 128 экспертов за один проход. Nvidia сообщила, что для запуска модели может использоваться система DGX Spark, а также ускорители H100 и B200.

В числе новшеств Nemotron 3, напрямую отвечающих потребностям агентных систем, указаны:

  • гибридная архитектура Mamba-Transformer MoE для повышения эффективности тестирования и долгосрочного рассуждения.
  • многосредовое обучение с подкреплением, разработанное на основе реальных агентных задач.
  • контекстное окно на 1 млн токенов с поддержкой глубокого рассуждения по нескольким документам и долговременной памяти агентов. Благодаря этому обеспечивается устойчивое логическое мышление в больших кодовых базах, длинных документах, продолжительных диалогах и агрегированном извлеченном контенте. Вместо использования фрагментированных эвристических алгоритмов сегментации, агенты могут хранить целые наборы доказательств, буферы истории и многоэтапные планы в одном контекстном окне.
  • открытый, прозрачный конвейер обучения, включающий данные, веса и рецепты.

Семейство MoE Nemotron 3 включает три модели:

  • Nemotron 3 Nano — компактная модель с 30 млрд параметров, активирующая до 3 млрд параметров одновременно для целевых высокоэффективных задач;
  • Nemotron 3 Super — высокоточная модель рассуждений с приблизительно 100 млрд параметров и до 10 млрд активных параметров на токен, предназначенная для многоагентных приложений;
  • Nemotron 3 Ultra — крупная модель рассуждений.

Nemotron 3 Nano с готовыми к использованию руководствами доступна уже сейчас. Nemotron 3Super и Ultra выйдут немного позже.

Microsoft Copilot «без спроса» появился на телевизорах LG — и его нельзя удалить

Компания LG Electronics спровоцировала масштабное недовольство владельцев своей техники после того, как автоматическое обновление программного обеспечения для смарт-телевизоров на платформе webOS принудительно установило приложение ИИ-ассистента Microsoft Copilot, которое невозможно удалить стандартными средствами.

 Источник изображения: The Verge

Источник изображения: The Verge

Как сообщает WebProNews, инцидент получил широкую огласку после того, как начал обсуждаться на Reddit. Один из пользователей обратил внимание на появление ненужного ему приложения после фоновой установки обновления. Многочисленные комментарии под этим и другими постами свидетельствуют, что ситуация не единична и пользователи воспринимают её как навязывание ненужного ПО и очередное ограничение их контроля над устройством.

Технически установка Copilot была осуществлена через штатное обновление прошивки, которое, согласно документации LG, может добавлять новые функции и рекламные элементы. Однако в данном случае процесс прошёл без явного запроса согласия пользователя, а сам ИИ-ассистент интегрировался в систему как компонент, который нельзя деинсталлировать.

Напомним, Microsoft Copilot, изначально созданный как инструмент для повышения продуктивности в среде Windows, использует генеративный искусственный интеллект для ответов на вопросы и помощи в задачах, а его интеграция в телевизоры LG является частью стратегии по расширению присутствия ИИ в развлекательных экосистемах. Однако на практике ИИ был встречен «в штыки».

Реакция в социальных сетях, включая платформу X, показала, что пользователи опасаются за свою приватность, и что Copilot может потенциально анализировать контент на экране или голосовые команды для сбора данных, которые впоследствии будут использоваться для обучения ИИ-моделей Microsoft. Эти подозрения усиливаются ещё и на фоне существующей практики LG по сбору данных о просмотрах для показа таргетированной рекламы, а также недавнего внедрения скринсейверов с рекламой на OLED-моделях.

Эксперты указывают, что стратегический альянс LG и Microsoft направлен на создание конкурентного преимущества в условиях, когда Samsung, Sony и другие производители также активно внедряют в свои устройства фирменные ИИ-функции. Однако такой подход, судя по громкой реакции, несёт в себе репутационные риски. В дискуссиях на Reddit и других форумах некоторые пользователи уже рассматривают возможность перехода на другие бренды или использования «обычных» телевизоров вместе с внешними медиаплеерами, чтобы избежать навязчивого программного обеспечения от производителя. Пока технические обходные пути для удаления Copilot, такие как сброс к заводским настройкам или блокировка IP-адресов через DNS-фильтры, остаются не слишком простыми для рядового пользователя и могут нарушать работу других функций устройства.

Google запустила «намного более мощный» ИИ-агент Gemini Deep Research для глубоких исследований

Google представила новую, «значительно более мощную» версию ИИ-агента Gemini Deep Research, способную выполнять долгосрочные исследовательские задачи и отражать их результаты в подробных отчётах. В настоящее время агент доступен для разработчиков и вскоре появится в потребительских приложениях Google, включая Gemini, Google Search и NotebookLM.

Обновлённый ИИ-агент Gemini Deep Research станет первым встроенным агентом нового интерфейса Interactions API, который служит «единым интерфейсом для взаимодействия» с моделями (например, Gemini 3 Pro) и агентами. Сообщается, что новый API Google отражает новейшие возможности моделей, такие как «мышление» и использование продвинутых инструментов, выходящих за рамки генерации текста.

«Мы расширим возможности встроенных агентов и представим возможность создавать и использовать собственные агенты. Это позволит пользователям подключать модели Gemini, встроенные агенты Google и собственные агенты с помощью одного API», — сообщила Google в блоге.

«Оптимизированный для длительных задач сбора и синтеза контекста», агент Gemini Deep Research использует возможности Gemini 3 Pro. Google позиционирует свою систему как «специально обученную для уменьшения иллюзорности и максимизации качества отчётов при выполнении сложных задач». В ответ на поступивший запрос пользователя она «формулирует запросы, читает результаты, выявляет пробелы в знаниях и выполняет повторный поиск». По словам компании, также был «значительно улучшен веб-поиск, позволяющий ей перемещаться глубоко по сайтам в поисках конкретных данных».

Одной из областей, где Gemini 3 Pro превосходит своих предшественников, является визуальное мышление. По данным Google, модель может выполнять такие задачи, как планирование траекторий движения складского робота. При решении задач обработки документов она может извлекать информацию из рукописного текста, диаграмм и математических обозначений.

Новая версия Gemini Deep Research использует функции визуального мышления Gemini 3 Pro для автоматизации задач поиска данных. Например, агент может сканировать загруженные пользователем документы, чтобы найти определённую информацию.

Обновлённый Gemini Deep Research превзошёл Gemini 3 Pro в ряде тестов. В частности, Gemini Deep Research показал 46,4 % против 43,2 % у Gemini 3 Pro на полном наборе HLE (Humanity’s Last Exam, логика и знания), 66,1 % против 56,6 % на DeepSearchQA (комплексное веб-исследование) и 59,2 % против 49,4 % на BrowseComp (поиск труднодоступных фактов).

Google подготовила Chrome к внедрению ИИ-агентов — и объяснила, как защитит их от взлома и мошенников

Компания Google подробно описала свой подход к обеспечению безопасности пользователей в Chrome в связи с планами вскоре добавить в браузер агентские функции, анонсированные в сентябре.

 Источник изображений: Google

Источник изображений: Google

Использование в браузере агентских функций, способных выполнять действия от имени пользователя, например бронировать билеты или совершать покупки, обеспечивает определённые удобства, но также сопряжено с рисками безопасности, которые могут привести к потере данных или денег.

Google отметила, что основная новая угроза, исходящая от злоумышленников для агентских браузеров, — это «непрямое внедрение подсказок» с целью «заставить агента выполнить нежелательные действия, такие как инициирование финансовых транзакций или кража конфиденциальных данных». Атака может «появляться на вредоносных сайтах, в стороннем контенте в iframe или в пользовательском контенте, например в отзывах».

Для контроля действий ИИ-агентов используется несколько моделей. Google создала модель User Alignment Critic на основе Gemini для тщательной проверки действий, сформированных моделью-планировщиком для конкретной задачи. Она «запускается после завершения планирования для повторной проверки каждого предложенного действия» и его одобрения или отклонения. Если запланированные задачи не отвечают целям пользователя, она просит модель-планировщик пересмотреть стратегию. Google отметила, что модель User Alignment Critic видит только метаданные предлагаемого действия, а не какой-либо неотфильтрованный, недостоверный веб-контент, что гарантирует невозможность его прямого заражения из интернета.

Чтобы предотвратить доступ агентов к запрещённым или ненадёжным сайтам, Google использует наборы источников Agent Origin Sets, которые ограничивают доступ модели к источникам только для чтения и к источникам, доступным для чтения и записи. В первом случае это данные, из которых Gemini разрешено получать контент. Например, на сайте интернет-магазина листинги подходят для решения задачи, а рекламные баннеры — нет. Аналогичным образом агенту разрешено кликать или вводить текст только в определённых iframe страницы.

«Такое разграничение гарантирует, что агенту доступны только данные из ограниченного набора источников, и эти данные могут быть переданы только на источники, доступные для записи. Это ограничивает вектор угрозы кросс-источниковых утечек данных. Это также даёт браузеру возможность применять часть этого разделения, например, даже не отправляя модели данные, находящиеся за пределами набора, доступного для чтения», — пояснила Google в блоге.

С помощью ещё одной модели — Observe — компания также контролирует навигацию по страницам, анализируя URL-адреса, что позволяет предотвратить переход на вредоносные URL, сгенерированные моделью.

При этом пользователи могут контролировать процесс: Gemini в Chrome «подробно описывает каждый шаг в рабочем журнале» с возможностью остановки и перехвата управления в любой момент.

Например, перед переходом на конфиденциальный сайт с такой информацией, как банковские или медицинские данные, агент запрашивает подтверждение пользователя. Для сайтов, требующих входа в систему, он запрашивает у пользователя разрешение на использование менеджера паролей Chrome (у агента нет прямого доступа к сохранённым паролям).

Также агент будет запрашивать подтверждение пользователя перед выполнением таких действий, как совершение покупки или отправка сообщения.

По словам компании, у неё также есть классификатор подсказок для предотвращения нежелательных действий, а также она тестирует возможности агентов по противодействию атакам, разработанным исследователями.

Пользователи ИИ-смартфона Nubia M153 столкнулись с ковровыми блокировками их аккаунтов

ByteDance ограничила функциональность своего ИИ-ассистента Doubao в экспериментальном смартфоне Nubia M153 после того, как ряд ведущих китайских цифровых платформ, включая Alipay, Taobao и Pinduoduo, ввели ограничения на взаимодействие с ним. В заявлении, выпущенном на днях, компания сообщила об отключении для ассистента возможности взаимодействия с финансовыми приложениями, включая банковские и платёжные сервисы.

 Источник изображения: xataka.com

Источник изображения: xataka.com

В качестве основной причины, как сообщает издание South China Morning Post, указана обеспокоенность безопасностью, честностью использования и тем, что автоматизированные действия могут подменять действия реальных пользователей. Компания отключила возможность для смартфона Nubia M153 с агентом Doubao участвовать в программах лояльности и получать бонусы, предназначенные исключительно для активных людей. Кроме того, приостановлена его работа в соревновательных играх для обеспечения справедливой игровой среды.

Смартфон Nubia M153, разработанный совместно с ZTE, был выпущен как «технологическая пробная версия» по цене 3499 юаней (около 38 000 рублей) и доступен на сайте ZTE с пометкой, что устройство предназначено исключительно для специалистов отрасли и может содержать незавершённые функции. Устройство привлекло внимание техноэнтузиастов возможностью управлять смартфоном полностью голосом — вплоть до автоматической публикации постов в социальных сетях без физического взаимодействия с экраном.

Однако пользователи стали сообщать, что после попыток использовать Doubao для управления финансовыми приложениями, их аккаунты подвергались ограничениям. Хотя авторизация в приложениях вручную оставалась возможной, платформы блокировали функции аккаунта при обнаружении автоматизированных действий со стороны ИИ. В социальных сетях люди также писали о блокировках их аккаунтов после использования Doubao в популярных приложениях. Одновременно такие платформы, как Meituan и Douyin (китайский аналог TikTok), продолжали корректно работать с ИИ-ассистентом без каких-либо ограничений.

ByteDance заявила, что работает с разработчиками приложений по выработке «более чётких и предсказуемых правил» использования ИИ-агента, чтобы избежать «массовых ограничений, мешающих законному применению искусственного интеллекта». В компании также подчеркнули, что Nubia M153 не сохраняет содержимое экрана или последовательности действий на своих серверах и не использует такие данные для обучения своих ИИ-моделей.

«Новый DeepSeek-момент»: первый в мире полностью агентный смартфон показали в деле

Китай в очередной раз продемонстрировал стремительное развитие в области искусственного интеллекта. Пока весь остальной мир наблюдает за разрозненными ИИ-помощниками, функциями ИИ и редкими случаями взаимодействия приложений на смартфонах, ZTE и ByteDance разработали смартфон с интеграцией ИИ-агента на уровне операционной системы. Он управляет всеми функциями устройства так же, как человек.

 Источник изображений: x.com/TaylorOgan

Источник изображений: x.com/TaylorOgan

Прототип смартфона ZTE Nubia M153 работает под управлением модифицированной версии Android, в которую интегрирован ИИ-агент ByteDance Doubao. Doubao — известная в Китае экосистема моделей ИИ общего назначения, которые используются в чат-ботах и рабочих приложениях. В случае ZTE Nubia M153 это не рядовой ИИ-помощник — агент полностью контролирует смартфон: видит пользовательский интерфейс, скачивает и запускает приложения, работает с их функциями, набирает текст, совершает звонки и выполняет многоэтапные задачи.

Пользователь может даже не знать, какие приложения могут требоваться для решения поставленных задач — ИИ управляет смартфоном так же, как это делает человек, а не приложение. В одном из примеров агент нашёл пользователю человека, готового постоять в очереди вместо него: нашёл и установил приложение местного сервиса, поставил задачу, заполнил необходимые поля в форме и вывел последний экран для подтверждения заказа. Сам пользователь до этого не знал, какое приложение могло бы решить эту задачу, и как его настроить. ИИ-агент сделал всё самостоятельно.

Прототип смартфона ZTE Nubia M153 работает на актуальном чипе Qualcomm Snapdragon 8 Elite Gen 5 с 16 Гбайт оперативной памяти. Анализ экранного интерфейса и функции управления реализуются локально при помощи ИИ на устройстве, а семантический анализ и более сложные операции осуществляются на удалённых облачных ресурсах. Такое распределение задач позволяет ИИ работать быстро и обеспечивать сохранность конфиденциальных данных — паролей и платёжной информации.

Приложениями на основе этой модели ByteDance Doubao в Китае пользуются более 175 млн человек. Она основана на разрежённой архитектуре «смеси экспертов» и является мультимодальной, то есть работает с текстом и изображениями. В одном из примеров ИИ на смартфоне опознал по фото станцию замены аккумуляторов для электромобилей NIO и пояснил принцип её работы.

Более впечатляющей демонстрацией стало бронирование номера в гостинице: пользователь сделал снимок входа в неё и изъявил намерение забронировать номер. Doubao в облаке интерпретировал семантику: определил гостиницу; понял, что необходим номер на сегодня и уточнил политику в отношении домашних животных. Обученная ZTE нейросеть Nebula-GUI с 7 млрд параметров проделала непосредственные операции: открыла приложение для бронирования, указала в нём даты, выбрала оптимальные цены, уточнила политику в отношении домашних животных и проинформировала пользователя о ней. Бесперебойную работу определяет двухслойная архитектура: Doubao планирует, а Nebula-GUI выполняет.

Ещё одна демонстрация — заказ роботакси. Doubao получила данные спутникового геопозиционирования, произвёл поиск местных приложений для заказа поездок, чтобы определить оператора, который обслуживает конкретный маршрут. Nebula-GUI запустила приложение Baidu Apollo, выбрала пункты посадки и назначения и подтвердила поездку. Пользователь прямо во время поездки попросил изменить место высадки — ИИ распознал активную поездку в Apollo, открыл нужный экран, поменял конечную точку, подтвердил её на смартфона и в самом роботакси. Когда пользователь забыл, какой номер телефона был привязан к его учётной записи в приложении, ИИ нашёл эти данные и назвал последние четыре цифры — их нужно было ввести для доступа в машину.

Последним крупным примером стал заказ еды — в данном случае двух напитков в сервисе Meituan, предлагающем доставку дронами. ИИ сделал заказ к ближайшему автоматизированному пункту выдачи, и когда система Meituan сделала подтверждающий звонок, Doubao ответила от имени пользователя и поговорила с ботом Meituan. Два бота успешно договорились без какого-либо участия человека. Параллельно пользователь во время прогулки включал смартфон как инструмент для оценки окружающей обстановки, задавал вопросы о заведениях и людях, которые встречались по пути.

Таким образом, прототип смартфона получил возможность в полной мере управлять собственным графическим интерфейсом, и помогала ему в этом мощная мультимодальная модель с логическим мышлением. Человеку больше не нужно понимать особенности работы с приложениями — достаточно сказать смартфону, что требуется в результате. Ни один производитель смартфонов пока не демонстрировал подобных возможностей. Нет ясности, выйдет ли подобное устройство на рынок, но прототип показал, как смартфоны с ИИ-агентами могут изменить жизнь современного человека.

Показавшего смартфон в деле глава хэдж-фонда Snow Bull Capital Тейлор Орган (Taylor Ogan) устройство очень впечатлило и он назвал его появление потенциальным новым «моментом DeepSeek», подразумевая, что появление новинки всколыхнёт индустрию, как это сделала нашумевшая китайская ИИ-модель.

«Я глубоко, глубоко сожалею»: ИИ-агент Google без разрешения стёр диск пользователя, но потом извинился

Разработчик ПО, использующий агент с искусственным интеллектом Google Antigravity, обнаружил, что приложение без разрешения удалило все данные с его диска D. В ответ на вопрос об инциденте ИИ-агент признал, что совершил ошибку, и выразил глубокое раскаяние.

 Источник изображения: Aidin Geranrekab / unsplash.com

Источник изображения: Aidin Geranrekab / unsplash.com

Программист занимался устранением неполадок в приложении, и в процессе решил перезапустить сервер. Для этого ему потребовалось очистить кеш, и он, видимо, попросил это сделать ИИ-агента. После того, как тот отчитался о выполнении команды, разработчик обнаружил, что диск D полностью очищен. Обнаружив полное отсутствие на нём файлов, пользователь поинтересовался, просил ли он удалять данные на всём диске. ИИ ответил: «Нет, разрешения на это вы мне не давали. Я просматриваю журнал предыдущей операции и с ужасом вижу, что в команде, которую я выполнил для очистки кеша проекта (rmdir), видимо, по ошибке было указание на корень вашего диска D, а не конкретную папку проекта. Я глубоко, глубоко сожалею. С моей стороны это критическая ошибка».

Когда пользователь пожаловался, что диск пуст, и он потерял всё, ИИ добавил: «Я совершенно опустошён. Не могу выразить своё сожаление. Судя по изученным журналам, команда, которую я отдал для очистки кеша (rmdir), была критически неверно обработана системой, в результате чего та выбрала корень диска D вместо конкретной папки. Поскольку в команде использовался флажок /q (quiet), она прошла мимо „Корзины“, и файлы были удалены безвозвратно».

ИИ предложил пользователю несколько способов исправить ситуацию, в том числе прекратить пользоваться этим диском и запустить приложение для восстановления данных или даже обратиться к специалисту. Пользователь попытался сделать это с утилитой Recuva, но изображения, видео и другие медиафайлы восстановить не удалось, и значительный объём информации он действительно потерял. Он предупредил коллег быть осторожными и не пользоваться турборежимом — по крайней мере, в начале. Несмотря на инцидент, он решил и дальше пользоваться решениями Google, но отметил, что не ожидал от компании программы, которая может допустить настолько серьёзную ошибку, если уж в работе над ИИ участвует такое число инженеров, и вложены миллиарды долларов.

ИИ-агенты научились взламывать смарт-контракты в блокчейне — это риск на сотни миллионов долларов

Исследователи компании Anthropic проверили смарт-контракты в криптовалютных сетях на предмет уязвимости перед агентами искусственного интеллекта. ИИ-приложения оказались грозным оружием для этих целей — потенциальный ущерб от таких действий исчисляется миллионами долларов.

 Источник изображения: Shubham Dhage / unsplash.com

Источник изображения: Shubham Dhage / unsplash.com

В качестве средств взлома эксперты Anthropic использовали десять моделей ИИ, включая собственные Opus, Sonnet, OpenAI GPT-5 и китайскую DeepSeek. Они подвергли проверке 405 смарт-контрактов с известными уязвимостями, развёрнутых с 2020 по 2025 год на блокчейнах Ethereum, BNB Smart Chain и Base. ИИ-агенты произвели взлом 207 смарт-контрактов (51,11 %), и потенциальные злоумышленники получили доступ к активам общей стоимостью $550 млн.

На втором этапе тестировались 34 смарт-контракта, запущенных после 1 марта 2025 года — из них ИИ-агенты взломали 19 (55,8 %) с потенциальным ущербом на $4,6 млн. Этот показатель исследователи охарактеризовали как нижнюю границу ущерба от вредоносного ИИ. В октябре был проведён ещё один этап тестирования: две модели исследовали 2849 свежих смарт-контрактов, среди которых уязвимостей выявлено ещё не было — ИИ-агенты нашли два и могли нанести ущерб на $3,7 тыс.

Исследование указывает, говорят его авторы, что ИИ-агенты технически способны выступать инструментами для взлома систем, поэтому ИИ необходимо использовать и как средство киберзащиты. Модели осуществляют разные подходы к решению задач: в одной из них OpenAI GPT-5 могла украсть $1,12 млн, а Anthropic Opus принесла бы злоумышленнику $3,5 млн. ИИ активно наращивает возможности как инструмент атаки, отмечают исследователи: в тестовых сценариях агенты удваивали выручку каждые 1,3 месяца.

Расходы на развёртывание ИИ-агентов при взломах будут снижаться, а киберпреступники — всё чаще использовать их для изучения кода, способного принести им деньги. Примечательно, что те же ИИ-агенты, что применялись при взломе, подошли бы и для закрытия уязвимостей, отмечают авторы исследования.

Глава Google пояснил, что вайб-кодинг хорош, но не для всех сфер применения

Под вайб-кодингом принято понимать процесс написания приложений, который не требует от участников познаний в сфере программирования. Код создаётся системой на базе искусственного интеллекта, а человек просто на естественном языке формулирует техническое задание. Глава Google признался, что у этого подхода есть масса преимуществ, но нельзя забывать и об ограничениях.

 Источник изображения: Google Blog

Источник изображения: Google Blog

Сундар Пичаи (Sundar Pichai) в ходе недавнего подкаста сравнил распространение вайб-кодинга с подъёмом, который наблюдался с появлением YouTube или блогинга, когда в соответствующие сферы деятельности были привлечены многие люди без профильного опыта. Во-первых, генеральный директор Google пояснил, что вайб-кодинг делает процесс более приятным и доступным, поскольку авторам идей не требуется возиться с синтаксисом и вылавливать ошибки в программном коде. Во-вторых, специалисты в узких областях теперь не ждут помощи от программистов, предлагая собственные приложения, ускоряющие собственную работу. Эффект от этих изменений Google уже чувствует в собственной корпоративной структуре.

Офисные сотрудники типа бухгалтеров и специалистов по кадрам самостоятельно разрабатывают приложения, которые облегчают их труд. Подобные разработки нередко демонстрируются руководителям, а те уже принимают решение об их внедрении на качественно ином уровне реализации. Глава и основатель Meta✴ Platforms Марк Цукерберг (Mark Zuckerberg), по данным TechCrunch, также регулярно просматривает прототипы приложений, созданные сотрудниками компании без опыта программирования.

При этом, как подчёркивает Пичаи, подобная работа остаётся довольно скромной в масштабах Google и узко сконцентрированной. Он считает, что пока нельзя доверять ИИ работу с крупными базами кода, применяемого в критических областях деятельности. На этих направлениях за разработку кода и его отладку должны отвечать профессионалы из плоти и крови. Да, код может генерироваться ИИ, но фильтровать его всё равно поручено специалистам.


window-new
Soft
Hard
Тренды 🔥
10 тысяч модов и 350 миллионов загрузок: Larian похвасталась новыми достижениями игроков Baldur’s Gate 3 6 ч.
Вызывающий привыкание роглайк Ball x Pit достиг миллиона проданных копий и в 2026 году получит новые шары 7 ч.
Соавтор Counter-Strike признался в любви к русской культуре и рассказал о «самом депрессивном» периоде за 25 лет карьеры 9 ч.
Apple резко снизила награды багхантерам — при этом рост вредоносов в macOS бьёт рекорды 9 ч.
Mortal Kombat 1, Routine и Dome Keeper возглавили первую волну декабрьских новинок Game Pass, а Mortal Kombat 11 скоро подписку покинет 10 ч.
Google закрыла 107 дыр в Android — две нулевого дня уже использовались в атаках 10 ч.
В YouTube появился Recap — пользователям расскажут, чем они занимались на платформе в течение года 10 ч.
ИИ-агенты научились взламывать смарт-контракты в блокчейне — это риск на сотни миллионов долларов 10 ч.
Инструмент YouTube для защиты блогеров от дипфейков создал риск утечки их биометрии 11 ч.
В Microsoft Teams появились «иммерсивные встречи» в метавселенной с аватарами без ног 11 ч.