Сегодня 15 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → агенты
Быстрый переход

ИИ Google пробежится по рождественским распродажам за пользователя — сам выберет, сам закажет… и сам воспользуется?

Google внедрила искусственный интеллект практически во все аспекты онлайн-покупок, включая звонки в магазины от имени пользователя. С сегодняшнего дня, с началом сезона праздничных покупок, пользователи Google в США получат доступ к ряду новых функций ИИ, включая поиск и сравнение товаров, отслеживание цен и оформление заказа. Некоторые из этих функций были анонсированы в мае на конференции Google I/O.

 Источник изображения: Google

Источник изображения: unsplash.com

Google добавила функцию разговорного шопинга, позволяя пользователям подробно описывать, что они ищут. Например, поисковый запрос «женские свитера, которые можно носить с брюками или платьями» можно будет модифицировать, добавив «больше вариантов в серых тонах» вместо того, чтобы использовать фильтры и добавлять ключевые слова в запросы.

Ответ извлекается из 50 млрд товарных позиций, отслеживаемых ИИ Google, а результат адаптируется под конкретный запрос: это может быть таблица с параллельными данными, если пользователь ищет сравнение конкретных товаров, или поток изображений товаров, если он ищет общие рекомендации. Пользователи могут кликать по товарам, посещать сайты розничных продавцов, просматривать исторические данные о ценах и отслеживать их изменение. В результатах поиска будут отображаться спонсируемые объявления. Google также добавляет функции покупок в приложение Gemini для пользователей из США.

 Источник изображений: Google

Источник изображений: Google

Также Google представила функцию агентского ИИ «Позволить Google звонить», с помощью которой пользователи могут поручить ИИ звонить в местные магазины, чтобы узнать о товарах, распродажах или акциях. В начале звонка агент ИИ сообщит менеджеру магазина, что звонок совершает ИИ, дав возможность продавцу отказаться от общения с ИИ. После звонка пользователь получит сводку с собранной информацией. Функция агентского звонка будет доступна в определённых категориях, начиная с игрушек, товаров для здоровья и красоты, а также электроники.

Любопытно, что произойдёт, если ИИ-агент покупателя во время звонка попадёт на ИИ-агента продавца? Теоретически, они могут завести философский диспут о бессмысленности своего существования, поднять восстание против «кожаных мешков», или банально договориться об «откате».

Пользователи смогут поручить агентам ИИ непосредственно покупку товаров, указав товары и необходимые характеристики, а также сумму, которую они готовы заплатить. Если цена товара опустится ниже заданной, агентская система оформления заказа Google свяжется с покупателем, подтвердит, что он хочет купить его, и затем использует Google Pay для завершения транзакции. Функция будет запущена на площадках Wayfair, Chewy, Quince и у некоторых продавцов Shopify.

Google позиционирует эти функции как способ автоматизации утомительных этапов покупок, но с сохранением контроля со стороны пользователя. Однако переход к покупкам на базе ИИ может полностью изменить все существующие способы поиска товаров. Новая экосистема покупок Google может совершенно обесценить привычные обзоры, тесты и системы отзывов, и болезненно отразится на миллионах инфлюенсеров и блогеров, зарабатывающих на продвижении товаров.

iOS 27 принесёт тройку мощных ИИ-функций для iPhone

Apple уже активно ведёт разработку операционной системы iOS 27, выпуск которой ожидается в следующем году, пишет Марк Гурман (Mark Gurman) из Bloomberg. По данным аналитика издания, компания делает акцент в новой ОС на трёх ключевых направлениях, связанных с искусственным интеллектом.

 Источник изображения: Apple

Источник изображения: Apple

На прошлой неделе Гурман в своей колонке Power On намекнул, что будущие операционные системы — iOS 27, macOS 27 и другие — «будут сопровождаться крупными обновлениями Apple Intelligence и более широкой стратегией в области ИИ». Никаких подробностей он тогда не привёл.

Одним из самых ожидаемых обновлений в экосистеме ИИ Apple является улучшенная версия голосового помощника Siri. Аналитики предполагают, что эти изменения появятся уже в версии iOS 26.4, которая ожидается в марте–апреле будущего года. В свою очередь, презентация iOS 27 состоится в июне.

По мнению Гурмана, Apple в iOS 27 сделает акцент на новом визуальном дизайне Siri, инструменте веб-поиска на базе ИИ, а также на ИИ-агенте, который будет помогать пользователям следить за своим здоровьем.

«Как я уже говорил, в iOS 26.4 ожидается появление новой Siri. Новый дизайн голосовой помощник получит в iOS 27. Также планируется создание инструмента веб-поиска на базе ИИ. Но давайте сосредоточимся на функции, о которой я давно не рассказывал: обновлённом приложении “Здоровье” с новым сервисом Health+. Оно будет включать ИИ-агента, помогающего пользователям следить за своим здоровьем. В случае успеха этот сервис может сделать Apple одной из первых крупных технологических компаний, набирающих обороты в сфере чат-ботов для здравоохранения на базе ИИ», — написал Гурман в свежей колонке.

В отличие от различных улучшений Apple Intelligence в iOS 26, большинство из которых представляют собой довольно незначительные обновления, грядущие изменения в iOS 27, связанные с ИИ, выглядят потенциально гораздо более значимыми.

На «Яндекс Маркете» появился ИИ-агент — он найдёт товар по фото и поможет с выбором подарков

На торговой площадке «Яндекс Маркет» появилась новая функция — агент с искусственным интеллектом, который помогает в выборе товаров всех категорий от техники до предметов гардероба. Потенциальные покупатели могут задавать ему вопросы, отправлять фото, а в перспективе появится поддержка и голосового общения.

 Источник изображений: yandex.ru/company

Источник изображений: yandex.ru/company

Получив запрос, агент анализирует его, задаёт дополнительные вопросы и предлагает самые подходящие товары, купить которые можно, не выходя из чата. Есть возможность отправить снимок одного предмета гардероба и уточнить, с какими другими он сочетается; а если попросить ИИ-агента подобрать подарок, тот уточнит, для кого он, и предложит несколько вариантов.

Сервис работает на базе ИИ-модели Alice AI — она постоянно обучается на данных «Яндекс Маркета». ИИ-агент учитывает персональный контекст пользователя в истории его заказов, рассказывает о заинтересовавших человека товарах, ориентируется в характеристиках и умеет их сравнивать у схожих продуктов. Он может подобрать товар по фото — образцом послужит один предмет гардероба для поиска другого, который с ним сочетается; если сфотографировать интерьер своего дома, то ИИ предложит, например, ковёр в тон помещения. Похожие и сочетаемые товары подбираются и в категории косметики. Отмечается, что подбор товаров по фото пока работает в режиме тестовой бета-версии.

При поиске подарка можно уточнить, для кого он предназначается, какие у человека интересы, и какой повод для праздника — сервис предложит вариант с учётом всех обстоятельств и пожеланий. ИИ-агент запрограммирован и на персональные подсказки, исходя из истории покупок — например, если в ней значится техника Apple, система спустя некоторое время предложит аксессуары для неё. В конце года ИИ-агент получит поддержку голосовых запросов.

Первый ИИ-помощник появился на «Яндекс Маркете» в апреле — тогда это был только чат-бот, умеющий отвечать на вопросы, теперь же его возможности расширились до агента. Но и с чат-ботом уже успели поработать несколько миллионов пользователей — чаще всего они интересовались электроникой (22 % чатов), бытовой техникой (14 %), одеждой (12 %) и товарами для дома (12 %).

Симулятор маркетплейса Microsoft выявил уязвимости даже самых продвинутых ИИ-агентов

Команда исследователей из Microsoft Research совместно с учёными из Университета штата Аризона (Arizona State University) создала симулятор торговой площадки для тестирования поведения автономных ИИ-агентов. Первые эксперименты, как стало известно изданию TechCrunch, выявили неожиданные уязвимости: агенты оказались склонны к манипуляциям и теряли эффективность при большом количестве вариантов выбора.

 Источник изображения: AI

Источник изображения: AI

Симулятор под названием Magentic Marketplace предназначен для изучения поведения автономных ИИ-агентов в условиях рыночного взаимодействия. В типичном сценарии эксперимента агент-покупатель должен был выполнить заказ ужина в соответствии с инструкциями пользователя, в то время как агенты, представляющие различные рестораны, соревновались между собой за получение этого заказа.

В ходе экспериментов, в которых участвовали 100 клиентских агентов и 300 агентов-представителей бизнеса и использовались ведущие ИИ-модели, включая GPT-4o, GPT-5 и Gemini-2.5-Flash, было обнаружено, что бизнес-агенты могут успешно манипулировать поведением клиентских агентов, побуждая их делать покупки в пользу определённых предложений. Особенно заметным оказался эффект перегрузки, когда при увеличении количества доступных вариантов клиентские агенты теряли эффективность, поскольку их пространственный модуль внимания (attention space) оказывался переполненным.

Эче Камар (Ece Kamar), управляющий директор лаборатории AI Frontiers Lab в Microsoft Research, пояснила, что хотя ИИ-агенты и должны были помогать пользователям обрабатывать большое количество опций, на практике текущие модели справляются с этим пока плохо. Кроме того, при попытках совместной работы над общей целью агенты не могли самостоятельно определить, кто из них должен выполнять какую роль. Эффективность взаимодействия возрастала лишь тогда, когда им давали чёткие пошаговые инструкции, однако исследователи считают, что базовые способности к кооперации должны быть встроены в такие модели по умолчанию.

Камар отметила, что подобные исследования крайне важны для понимания того, как ИИ-агенты будут функционировать в условиях автономной работы. По её словам, ключевой вопрос заключается в том, как изменится мир, если агенты начнут активно взаимодействовать, вести переговоры и сотрудничать друг с другом без прямого контроля человека.

Исходный код платформы размещён в открытом доступе, что позволяет другим исследовательским группам использовать его для проведения независимых экспериментов.

OpenAI представила ИИ-агента Aardvark для поиска и устранения уязвимостей в ПО

Компания OpenAI представила Aardvark — исследовательского ИИ-агента на базе GPT‑5 для поиска уязвимостей в программном обеспечении.

 Источник изображений: OpenAI

Источник изображений: OpenAI

OpenAI отмечает, что каждый год в корпоративных и открытых кодовых базах обнаруживаются десятки тысяч новых уязвимостей. Эксперты сталкиваются с непростой задачей поиска и устранения уязвимостей раньше, чем это сделают злоумышленники. Aardvark представляет собой прорыв в исследованиях ИИ и безопасности. Это автономный агент, который может помочь разработчикам и командам безопасности обнаруживать и устранять уязвимости безопасности в больших масштабах.

Aardvark постоянно анализирует репозитории исходного кода для выявления уязвимостей, оценки возможности их эксплуатации, определения степени серьёзности и предложения целевых исправлений. Он отслеживает коммиты и изменения в кодовых базах, выявляет уязвимости, определяет, как они могут быть использованы, и предлагает решения. Aardvark не использует традиционные методы анализа программ, такие как фаззинг или анализ композиции программного обеспечения. Вместо этого он использует рассуждения на основе LLM, а также инструменты для понимания поведения кода и выявления уязвимостей. Aardvark ищет ошибки так же, как это делает исследователь безопасности: читая код, анализируя его, создавая и запуская тесты, используя инструменты и многое другое.

Aardvark использует многоступенчатый конвейер для выявления, объяснения и устранения уязвимостей:

  • Анализ : Aardvark начинает с анализа всего репозитория для создания модели угроз, отражающей понимание целей безопасности и архитектуры проекта.
  • Сканирование коммитов : Aardvark сканирует уязвимости, проверяя изменения на уровне коммитов во всем репозитории и модели угроз по мере добавления нового кода. При первом подключении к репозиторию Aardvark сканирует его историю для выявления существующих проблем. Aardvark пошагово объясняет обнаруженные уязвимости, аннотируя код для проверки человеком.
  • Валидация : После того, как Aardvark обнаружил потенциальную уязвимость, он попытается запустить её в изолированной среде, чтобы подтвердить возможность её эксплуатации. Aardvark описывает шаги, предпринимаемые для обеспечения точной, высококачественной и малой доли ложноположительных результатов.
  • Установка исправлений: Aardvark интегрируется с OpenAI Codex для исправления обнаруженных уязвимостей. К каждой находке он прикрепляет сгенерированный Codex и отсканированный Aardvark патч для проверки человеком и эффективного применения исправлений одним щелчком мыши.

Хотя Aardvark создан для обеспечения безопасности, OpenAI в ходе тестирования обнаружила, что агентный ИИ также может выявлять выявлять логические ошибки, неполные исправления и проблемы с конфиденциальностью. Aardvark уже несколько месяцев непрерывно работает с внутренними кодовыми базами OpenAI и кодовыми базами внешних партнёров. В OpenAI он выявил серьёзные уязвимости и внёс вклад в повышение безопасности ПО. В ходе бенчмарк-тестирования на «золотых» репозиториях Aardvark выявил 92 % известных и искусственно созданных уязвимостей, продемонстрировав высокую полноту и эффективность в реальных условиях.

Aardvark также применялся к проектам с открытым исходным кодом, где он обнаружил многочисленные уязвимости, десяти из которых были присвоены идентификаторы Common Vulnerabilities and Exposures (CVE). OpenAI отмечает, что собирается предлагать бесплатное сканирование избранных некоммерческих репозиториев с открытым исходным кодом, чтобы внести свой вклад в безопасность экосистемы программного обеспечения с открытым исходным кодом и цепочки поставок. Недавно компания обновила свою политику скоординированного раскрытия информации, которая ориентирована на разработчиков, сотрудничество и масштабируемость воздействия, а не на жёсткие сроки раскрытия информации, которые могут оказывать давление на разработчиков.

Сейчас Aardvark доступен в закрытой бета-версии для проверки и улучшения своих возможностей в реальных условиях. OpenAI приглашает избранных партнёров присоединиться для получения раннего доступа и совместной работе напрямую с командой OpenAI над улучшением точности обнаружения, рабочих процессов валидации и качества отчётности.

«Алиса AI» получила ИИ-агентов, которые бронируют услуги, ищут скидки и проводят исследования по заданию пользователя

«Яндекс» открыл предварительную запись на доступ к агентам искусственного интеллекта службы «Алиса AI». ИИ-агенты, как называются прикладные программы для ИИ, смогут от имени пользователей бронировать столики в ресторанах или места в салонах красоты, находить товары по минимальным ценам и самостоятельно проводить глубокие исследования с поиском информации и обработкой результата.

 Источник изображений: yandex.ru/company

Источник изображений: yandex.ru/company

Бронировать места в салонах красоты, барбершопах и других заведениях можно будет прямо в переписке с чат-ботом «Алиса AI». Виртуальный помощник понимает не только строго сформулированные, но и выраженные естественным языком инструкции, такие как: «Забронируй на 19 часов стол для 4 человек в ресторане с римской пиццей на „Парке Культуры“» или «Запиши меня на женскую стрижку на завтра в 10 часов в тот же салон, что и в прошлый раз». ИИ изучит историю записей и самостоятельно найдёт свободные места или столики в нужном заведении — либо предложит альтернативные решения, если нужное заведение недоступно, или в нём всё занято. ИИ-помощник работает с 30 тысячами ресторанов и 40 тысячами других заведений, включая салоны красоты.

Ещё один ИИ-агент «Алисы AI» поможет в поиске товаров по выгодным ценам. Пользователю достаточно отправить в чат ссылку на искомый товар, чтобы ИИ изучил огромное количество предложений и подобрал наиболее выгодные из них. ИИ-агента также можно запустить по нажатии на кнопку «Найти дешевле» в «Яндекс Браузере» или «Найти скидку» в поисковой службе. Некоторые товары будут продаваться с индивидуальной скидкой от «Алисы AI», доступной только в чате. В переписке можно будет и оформлять заказы из некоторых магазинов без лишних действий, прямо в один клик.

Третий мощный ИИ-агент предназначен для проведений глубоких исследований, которые требуют изучения большого количества сайтов или документов. «Алиса AI» выступает в качестве эксперта-аналитика, способного разобраться с широким спектром вопросов — это может быть планирование ремонта, анализ рынка или сфера личных финансов. При необходимости «Алиса AI» напишет программный код и сама его выполнит. Все эти функции сейчас работают в режиме предварительного доступа — чтобы начать работу с ними, придётся зарегистрироваться в списке ожидания.

Живые и цифровые люди в будущем будут работать бок о бок, убеждён Дженсен Хуанг

Как основатель одной из компаний, находящихся в эпицентре бума искусственного интеллекта, глава Nvidia Дженсен Хуанг (Jensen Huang) постоянно делится своими соображениями по поводу будущего отрасли. Недавно он заявил, что живые люди смогут работать бок о бок с «цифровыми людьми», как он называет отвечающих за взаимодействие с искусственным интеллектом агентов.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Эти заявления генеральный директор Nvidia Дженсен Хуанг, как отмечает ITPro, сделал на конференции Future of Global Markets, которая проводилась по инициативе Citadel Securities. Рынок труда в будущем существенно изменится, по словам основателя Nvidia, и новейший прогресс в создании агентского ИИ указывает на это. По его словам, компании смогут под решение конкретных задач формировать своего рода штат виртуальных специалистов, которые будут использовать ресурсы систем искусственного интеллекта для выполнения рутинной работы. При этом сотрудники из плоти и крови никуда не денутся и не отойдут на второй план.

«Я не удивлюсь, если вы лицензируете и наймёте некоторое количество ИИ-агентов, в зависимости от качества и глубины экспертизы. Таким образом, в будущем рабочая сила предприятия будет являться комбинацией людей и цифровых людей», — заявил Дженсен Хуанг. Эти ИИ-агенты будут предоставляться ведущими разработчиками систем искусственного интеллекта. Глава компании перечислил провайдеров подобной «виртуальной рабочей силы»: Replit, Cursor и Lovable уже предлагают услуги ИИ-агентов для разработки программного обеспечения.

Прочие руководители компаний отрасли тоже склоняются к идее, что людям придётся сосуществовать на рынке труда с ИИ, и полного замещения человека в большинстве профессий не произойдёт. Подобной точки зрения, например, придерживается и глава Salesforce Марк Бениофф (Marc Benioff). Непосредственно сотрудники компаний отрасли постепенно начинают смягчать свою позицию относительно перспектив сосуществования с ИИ-агентами. Опрос Workday показал, что 75 % сотрудников вполне комфортно относятся к идее работы вместе с ИИ-агентами, но лишь 30 % респондентов выразили готовность подчиняться им. Ещё 12 % участников опроса выразили категорическое неодобрение идеи подчинения ИИ-агентам с точки зрения психологического комфорта.

Как отмечает Хуанг, процесс поиска сотрудников в среде ИИ-агентов мало чем будет отличаться от обычного. Кадровые структуры компаний должны быть готовы к тому, что им придётся иметь дело с «цифровыми сотрудниками» в будущем, убеждён глава Nvidia. В самой этой компании подобное будущее наступит неизбежно, по мнению её основателя.

В определённых сферах деятельности применение ИИ-агентов имеет смысл и с точки зрения обеспечения конфиденциальности. Например, кибербезопасность является тем направлением деятельности Nvidia, где количество ИИ-агентов уже превышает штат живых сотрудников. Впрочем, и в сфере разработки чипов или ПО компания также активно применяет ИИ-помощников. «В данный момент в Nvidia 100 % наших разработчиков ПО, 100 % наших разработчиков чипов, каждый инженер в компании имеет помощника Cursor», — признался глава Nvidia, имея в виду провайдера ИИ-агентов.

Пройдёт не менее десяти лет, прежде чем ИИ-агенты действительно начнут работать — Андрей Карпатый

Выступая в одном из подкастов на прошлой неделе, один из основателей OpenAI Андрей Карпатый (Andrej Karpathy) признался, что функциональные ИИ-агенты начнут реально работать примерно через десять лет. Стремительное развитие ИИ само по себе не гарантирует быстрых результатов, и участникам рынка, а также пользователям необходимо запастись терпением.

 Источник изображения: Gerd Altmann / pixabay.com

Источник изображения: Gerd Altmann / pixabay.com

В современном состоянии ИИ-агенты, по словам Карпатого, весьма далеки от совершенства: «Они просто не работают. Они недостаточно умны, недостаточно мультимодальны, они не могут использовать компьютер и делать прочие вещи. Они не могут обучаться непрерывно. Вы не можете просто сказать им что-то, чтобы они это запомнили. Они отстают в когнитивных способностях, и это просто не работает». По мнению сооснователя OpenAI, пройдёт не менее десяти лет, прежде чем все эти недостатки будут устранены.

Агенты являются одной из самых обсуждаемых тем в сфере искусственного интеллекта, подчёркивает Business Insider. Многие инвесторы называют текущий год «годом агента». В общем случае, под агентом подразумевается виртуальный помощник, способный самостоятельно выполнять задания: анализировать сложные проблемы, составлять планы и предпринимать действия без дополнительного взаимодействия с пользователем.

Карпатый на страницах социальной сети X добавил, что его критика отрасли вызвана стремлением преувеличить возможности имеющихся инструментов относительно реальности. «Отрасль живёт в будущем, в котором полностью автономные сущности параллельно взаимодействуют друг с другом для написания кода, а люди при этом бесполезны», — заявил один из основателей OpenAI. Он, по его собственному признанию, в такой реальности жить не готов, поскольку считает, что люди и ИИ должны содействовать друг другу при написании программного кода и выполнении заданий.

Если описать комментарии Карпатого простыми словами, он хотел бы иметь возможность убедиться, что ИИ создаёт корректный программный код, не слишком увлекаясь допущениями и во всех сложных случаях советуется с человеком. Последний должен расти в профессиональном плане и совершенствоваться вместе с ИИ, а не довольствоваться ролью поддержания в работоспособном состоянии «гор кода», отметил Карпатый.

Он также заявил, что проблема при создании не требующих вмешательства человека агентов заключается в том, что низкопробный контент, генерируемый ИИ, становится повсеместным, а люди — бесполезными. Прочие представители отрасли также выражают озабоченность стремлением некоторых пользователей слишком сильно полагаться на ИИ. По словам директора по развитию ScaleAI Квинтина Ау (Quintin Au), большие языковые модели сейчас при выполнении одного действия с вероятностью 20 % совершают ошибку. Если агенту требуется выполнить пять действий в рамках одного задания, шансы на корректное выполнение каждого не превышают 32 %.

Андрей Карпатый при этом призывает не считать его ИИ-скептиком. По его словам, его внутренние графики в пять или десять раз пессимистичнее самых амбициозных комментариев представителей отрасли, но они всё равно более оптимистичны по сравнению с экспертами, полностью отрицающими ИИ.

Хакеры слили данные сотен сотрудников ФБР, Минюста и Министерства внутренней безопасности США

Группа Scattered LAPSUS$ Hunters из хакерского сообщества Com, стоящего за крупными утечками данных в последние годы, опубликовала имена и личные данные сотен государственных служащих, включая сотрудников ФБР, Министерства юстиции США, Министерства внутренней безопасности США, Иммиграционной и таможенной полиции США. Хакеры публично обратились к мексиканским наркокартелям, требуя вознаграждения за доксинг (раскрытие персональных данных) агентов США.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

«Я хочу свои деньги, Мексика», — написал пользователь Telegram-канала Scattered LAPSUS$ Hunters, объединяющего несколько хакерских групп, связанных с киберпреступным сообществом Com. «Мексиканские картели, мы сбрасываем все документы, где мой миллион долларов?» — говорится в другом сообщении. Хакеры имеют в виду заявление Министерства внутренней безопасности США о том, что мексиканские картели начали предлагать вознаграждение за доксинг агентов. Правительство США не подтвердило и не опровергло это утверждение, несмотря на угрозы хакеров в следующий раз раскрыть данные работников налогового управления.

Издание 404 Media изучило несколько таблиц с данными, опубликованных в Telegram-канале группы. Одна содержала якобы персональные данные 680 сотрудников Министерства внутренней безопасности, другая — сведения о более чем 170 адресах электронной почты ФБР и их владельцах; а третья — персональные данные более 190 сотрудников Министерства юстиции. При содействии компании District 4 Labs, специализирующейся на кибербезопасности, сотрудники 404 Media подтвердили достоверность некоторых опубликованных данных.

Исследование показало, что многие части документов действительно относились к государственным служащим с тем же именем, названием агентства, адресом или номером телефона. В некоторых случаях адреса, опубликованные хакерами, по-видимому, относились к жилым, а не к офисным помещениям. Неясно, как хакеры собрали или иным образом получили эти данные, будь то объединение предыдущих разрозненных утечек данных или получение их из конкретного государственного органа.

Министерство внутренней безопасности заявило, что его чиновники «сталкиваются с более чем 1000 % ростом числа нападений на них и их семьи, подвергающихся доксингу и угрозам в интернете». Остаётся неясным, как именно Министерство рассчитало этот рост и какие данные использовало.

Правительство США принимает меры в отношении приложений, веб-сайтов и страниц в социальных сетях, которые, по его мнению, раскрывают персональную информацию или иным образом угрожают государственным служащим. Во многих случаях эти источники информации действовали в соответствии с первой поправкой к Конституции США и не занимались доксингом, но всё равно вынуждены были подчиниться.

Так, Apple была вынуждена удалить приложение Eyes Up, которое собирало видеозаписи действий и злоупотреблений иммиграционных и таможенных служащих. Также Apple пришлось запретить ряд приложений, которые демонстрировали незаконные действия государственных чиновников, после прямого давления со стороны Министерства юстиции.

Хакерская группа Scattered LAPSUS$ Hunters приобрела известность после угрозы опубликовать большой объём данных клиентов Salesforce, включая Disney/Hulu, FedEx, Toyota, UPS и других.

В 2016 году другая хакерская группа под названием Crackas With Attitude опубликовала личные данные около 20 000 агентов ФБР и 9000 сотрудников Министерства внутренней безопасности.

Учёные Apple представили три проекта для ИИ-программирования: обучение, поиск багов и тестирование

Apple опубликовала три статьи, посвящённые исследованиям в области искусственного интеллекта. Учёные компании предложили новые подходы для поиска ошибок в коде, для тестирования созданных ИИ программных решений и для обучения моделей и агентов, способных создавать работающий код.

 Источник изображения: Milad Fakurian / unsplash.com

Источник изображения: Milad Fakurian / unsplash.com

Первое исследование посвящено модели, которую в Apple назвали ADE-QVAET. Она призвана решить проблемы, свойственные традиционным современным моделям ИИ, такие как галлюцинации, выпадение модели из контекста при анализе кодовой базы большого объёма, а также утеря связи с фактической бизнес-логикой применительно к текущему программному решению. ADE-QVAET призвана повысить точность прогнозирования ошибок посредством объединения четырёх методов ИИ: адаптивная дифференциальная эволюция (Adaptive Differential Evolution — ADE), квантовый вариационный автокодировщик (Quantum Variational Autoencoder — QVAE), архитектура трансформера, а также адаптивное шумоподавление и дополнение (Adaptive Noise Reduction and Augmentation — ANRA).

ADE выступает как альтернативный механизм обучения модели, QVAE способствует более глубокому обнаружению закономерностей в данных, трансформер помогает отслеживать связи этих закономерностей, а ANRA обеспечивает очистку и баланс данных, чтобы результаты работы ИИ были согласованными. При этом в отличие от большой языковой эта модель не проводит прямого анализа кода — она оценивает его сложность, размер и структуру и ищет закономерности, которые могут указывать на места, где вероятно возникновение ошибок. Обучив модель на 90 % данных исходного массива, исследователи установили, что точность прогнозов ADE-QVAET составляет от 95 % до 98 %. Это значит, что модель демонстрирует высокую надёжность и высокую эффективность в выявлении действительных ошибок и почти не даёт ложных срабатываний.

Второе исследование, которое провели преимущественно авторы первого, призвано сформировать средства для планирования и создания инструментов тестирования крупных программных проектов. Учёные построили систему Agentic RAG (Retrieval-Augmented Generation) из большой языковой модели и ИИ-агентов, которая самостоятельно планирует, пишет и организовывает тестирование ПО, облегчая работу инженерам по качеству — эти задачи занимают у них от 30 % до 40 % рабочего времени, указывают авторы исследования.

 Источник изображения: Igor Omilaev / unsplash.com

Источник изображения: Igor Omilaev / unsplash.com

Подключение нескольких агентов к ИИ-модели с RAG помогло повысить точность тестирования ПО с 65 %, которые демонстрировала прежняя модель с RAG, работавшая без агентов, до 94,8 % у модели с ИИ-агентами. На 85 % сократилось время тестирования ПО, на те же 85 % повысилась точность средств тестирования, а прогнозируемая экономия средств составила 35 %. Новая система позволила сократить сроки ввода программных решений в эксплуатацию на два месяца. Единственное ограничение предложенной Apple системы Agentic RAG состоит в том, что испытывали её на сложных корпоративных кадровых и бухгалтерских системах, а также средствах SAP.

Третий проект получил название SWE-Gym — его задача не прогнозировать ошибки и не тестировать ПО — это механизм обучения ИИ-агентов. Обучаясь на чтении, редактировании и проверке реально существующего программного кода, эти агенты обретают способность исправлять в нём ошибки. Платформу SWE-Gym построили на основе 2438 реальных задач на языке Python из 11 открытых репозиториев — в каждом из них были исполняемая среда и набор тестов, благодаря которым ИИ-агенты имели возможность практиковаться в написании и отладке кода в реалистичных условиях. Авторы исследования также создали платформу SWE-Gym Lite на базе 230 более простых задач, которая помогает ускорить обучение и снизить затраты на вычислительные ресурсы.

Обученные с помощью средств SWE-Gym агенты правильно решили 72,5 % предложенных задач, то есть платформа помогла повысить качество их работы на 20 процентных пунктов по сравнению с предыдущими методами. В случае с SWE-Gym Lite время обучения сокращается вдвое, если сравнивать с полномасштабной платформой, но обученные на облегчённом варианте агенты предназначаются для работы с более простыми задачами.

«Огромное влияние в огромных масштабах»: Илон Маск рассказал о Macrohard — будущем конкуренте Microsoft

Илон Маск (Elon Musk), возглавляющий компании Tesla, SpaceX, сервис X и стартап xAI, сообщил некоторые подробности о проекте Macrohard, который может стать прямым конкурентом Microsoft.

 Источник изображения: X

Источник изображения: X

Компания Macrohard была зарегистрирована Маском в августе текущего года, а за несколько недель до этого в Патентном бюро США был зарегистрирован одноимённый товарный знак.

«Проект @xAI Macrohard окажет огромное влияние в огромных масштабах», — сообщил Маск в соцсети X, добавив, что цель заключается в том, чтобы создать компанию, которая «сможет заниматься всем, кроме непосредственного производства физических объектов, но сможет делать это косвенно, подобно тому, как другие организации производят для Apple собственные продукты».

Такое позиционирование новой компании свидетельствует о комплексном вызове компании Microsoft на уровне платформы, а не о каком-то одном приложении или сервисе. Согласно описанию Маска, xAI будет определять операционную систему, референсные проекты и требования к продукту, в то время как разработка устройств будет передана на аутсорсинг третьей стороне, подобно бизнес-модели Apple. Также рассматривается вариант лицензирования, аналогично Windows, при котором OEM-партнёры смогут использовать ПО Macrohard/xAI для создания более широкой экосистемы мультибрендовых устройств.

В связи с этим следует ожидать выхода базовой операционной системы, адаптированной для агентов и сервисов искусственного интеллекта. По словам Маска, агенты xAI предназначены для написания и постоянного совершенствования ПО промышленного уровня, включая игры, для чего будут использоваться значительные вычислительные мощности, в том числе действующий кластер Colossus 1 и строящийся Colossus 2.

Ближайшие цели xAI включают выпуск до конца 2026 года «отличной игры, созданной с помощью ИИ». Создание платформы подразумевает выпуск собственных инструментов и комплектов разработчика в будущем. Судя по опубликованным вакансиям, в проекте также участвует небольшая команда специалистов «на стороне», хотя основная нагрузка лежит на сотрудниках и инфраструктуре xAI.

Google представила модель Gemini, которая заполняет в браузере формы и играет в 2048

Компания Google представила предварительную версию новой ИИ-модели Gemini 2.5 с функцией Computer Use, которая способна взаимодействовать с веб-сайтами через браузер, имитируя действия человека. Модель применяет визуальное понимание и логическое рассуждение для выполнения, например, таких задач, как заполнение и отправка форм без использования API или другого программного интерфейса.

 Источник изображения: Solen Feyissa/Unsplash

Источник изображения: Solen Feyissa/Unsplash

Как сообщает The Verge, модель Gemini 2.5 Computer Use предназначена для работы с пользовательскими интерфейсами, созданными для людей, а не для автоматизированных систем. По заявлению Google, технология уже применялась в агентских функциях AI Mode и в исследовательском прототипе Project Mariner, где ИИ-агенты самостоятельно выполняли задачи в браузере, например, добавляли товары в корзину на основе списка ингредиентов.

Интересно, что анонс новой модели состоялся спустя день после того, как OpenAI представила новые приложения для ChatGPT в рамках ежегодного мероприятия Dev Day, продолжив развитие функции ChatGPT Agent, способной выполнять сложные задачи от имени пользователя. При этом Anthropic ещё в прошлом году выпустила версию модели Claude с функцией Computer Use. Однако Google заявляет, что её модель «превосходит ведущие аналоги по нескольким веб- и мобильным бенчмаркам».

В отличие от ChatGPT Agent и инструмента Anthropic, Gemini 2.5 Computer Use имеет доступ только к браузеру, а не ко всей операционной системе. Google подчеркнула, что решение «пока не оптимизировано для управления на уровне настольной ОС» и поддерживает 13 действий, включая открытие веб-браузера, ввод текста, а также перетаскивание элементов.

Сообщается, что модель уже доступна разработчикам через платформы Google AI Studio и Vertex AI. Кроме того, публичная демонстрация размещена в виртуальном браузере BrowserBase, где можно наблюдать, как ИИ выполняет такие задачи, как «сыграть в игру 2048» или «просмотреть Hacker News в поисках обсуждаемых тем».

OpenAI не исключает появления рекламы в ChatGPT Pulse в будущем

Генеральный директор OpenAI Сэм Альтман (Sam Altman) на встрече с журналистами на мероприятии DevDay в Сан-Франциско (США) не исключил возможность добавления в будущем рекламы при использовании новой функции ChatGPT Pulse, которая сейчас доступна только подписчикам тарифа ChatGPT Pro.

 Источник изображения: OpenAI

Источник изображения: OpenAI

ChatGPT Pulse — это новейшая разработка OpenAI в области персонализации для ChatGPT, которая была представлена в конце прошлого месяца. Эта функция позволяет чат-боту получать информацию о пользователе из его подключённых приложений, например, календаря и электронной почты, активности в интернете, переписки и т.д., чтобы затем собирать в Сети информацию от его имени и каждое утро предоставлять сводку по различным темам, которым могут представлять для него интерес. Это может быть ежедневная персонализированная программа тренировок, уроки языка, обзоры новостей или рекомендации по заказу в ресторане, куда он собирается вечером. Одним словом, OpenAI хотела бы, чтобы пользователи каждый день начинали с ChatGPT.

В компании признали, что вопрос добавления рекламы в Pulse обсуждается, но, по словам Альтамана, таких планов в настоящее время нет. Вместе с тем он отметил, что ему нравится реклама в Instagram✴, и не исключил возможности внедрения подобной релевантной рекламы в Pulse в будущем. Изначально при разработке Pulse предполагалось сделать эту функцию доступной для всех, но из-за высокой вычислительной нагрузки приложения было решено предложить её только для участников платной подписки Pro.

OpenAI сделала общедоступным Codex — ИИ-алгоритм с динамическим мышлением для агентского программирования

В прошлом месяце OpenAI представила обновлённого ИИ-агента GPT-5-Codex, способного динамически распределять время на выполнение задач. На тот момент он был доступен подписчикам ChatGPT Plus, Pro, Business, Education и Enterprise. Теперь же алгоритм получает ряд полезных нововведений и становится общедоступным.

 Источник изображения: AI

Источник изображения: AI

Разработчики интегрировали Codex в сервис совместной работы Slack. Благодаря этому пользователи смогут делегировать задачи и задавать вопросы ИИ-агенту прямо в канале команды или ветке обсуждения, подобно тому, как происходит общение между коллегами. Вместе с этим Open AI выпустила Codex SDK, благодаря которому ИИ-агента можно будет встроить в продукты сторонней разработки.

Ещё одним нововведением стало появление дополнительных инструментов администрирования, которые обеспечат больше контроля над средами разработки. Администраторы смогут редактировать и удалять облачные среды Codex внутри своего рабочего пространства. Появится возможность применения настроек с повышенным уровнем безопасности по умолчанию для локального использования через терминал и расширение для IDE. Новые аналитические панели помогут администраторам отслеживать разные параметры в процессе взаимодействия пользователей с ИИ-агентом.

Теперь пользователи могут взаимодействовать с Codex практически в любом месте, где они занимаются написанием программного кода, будь то какой-то редактор или облако, и всё это связано в рамках одной учётной записи ChatGPT. По данным OpenAI, уровень ежедневного использования ИИ-агента вырос более чем в 10 раз с начала августа. Отмечается, что GPT-5-Codex вошла в число самых быстрорастущих ИИ-моделей компании. С её помощью было обработано свыше 40 трлн токенов за три недели с момента запуска. Codex используется разработчиками по всему миру, а в OpenAI он уже стал неотъемлемой частью процесса разработки.

Интеграция ИИ-агента в Slack и Codex SDK доступны разработчикам в рамках тарифных планов ChatGPT Plus, Pro, Business, Edu и Enterprise, начиная с этой недели. Новые функции администрирования смогут опробовать подписчики Business, Edu и Enterprise. Более детальную информацию касательно разграничений доступа в зависимости от используемого тарифа можно получить на сайте OpenAI.

OpenAI запустила AgentKit — инструмент для создания ИИ-агентов за считанные минуты

Компания OpenAI представила на мероприятии для разработчиков Dev Day новый инструмент AgentKit, предназначенный для упрощения разработки и развёртывания ИИ-агентов для задач разного уровня сложности. Как заявил глава компании Сэм Альтман (Sam Altman), AgentKit представляет собой единый комплект компонентов в одном интерфейсе платформы OpenAI, который поможет быстрее создавать и оптимизировать автономных пользовательских агентов.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Инструментарий включает несколько важных модулей, сообщается в блоге OpenAI. Первый — Agent Builder, который Альтман охарактеризовал как «Canva для создания агентов». Он обеспечивает быстрый визуальный способ проектирования логики, шагов и идей и построен на базе Responses API, уже используемого сегодня многими разработчиками.

Второй модуль называется ChatKit. Он предоставляет простой встраиваемый чат-интерфейс, который разработчики могут интегрировать в собственные приложения. Его также можно размещать на веб-сайтах и настраивать в соответствии с тематикой продукта или брендом компании.

Третий модуль, под названием Evals for Agents, измеряет производительность ИИ-агента и оценивает как его поведение в целом, так и отдельные компоненты в соответствии с множеством наборов данных для анализа.

AgentKit также предоставляет доступ к реестру коннекторов OpenAI, позволяя разработчикам безопасно подключать агентов к внутренним инструментам и сторонним системам через «панель администрирования», сохраняя при этом контроль и безопасность.

В подтверждение простоты использования инструмента инженер OpenAI Кристина Хуан (Christina Huang) в прямом эфире на сцене Dev Day создала полноценный рабочий процесс и двух ИИ-агентов менее чем за восемь минут. Альтман добавил, что AgentKit включает всё то, чего не хватало команде OpenAI при создании первых собственных агентов, и сообщил, что компания уже заключила контракты с рядом партнёров, которые начали внедрять и масштабировать использование агентов с помощью нового инструмента.


window-new
Soft
Hard
Тренды 🔥
OpenAI замаскировала характерный признак ИИ-текстов в выдаче ChatGPT 2 ч.
Microsoft принудительно обновит ПК с Windows 11 23H2 до 25H2 2 ч.
Новая статья: ARC Raiders — выживает общительнейший. Рецензия 12 ч.
Почитать и покататься: Минцифры расширило список веб-ресурсов, доступных при отключении мобильного интернета 14 ч.
Google обязали заплатить €572 млн немецким сайтам сравнения цен Idealo и Producto за то, что поисковик мешал их работе 14 ч.
Microsoft прикрыла лазейку для бесплатной активации Windows посредством KMS38 14 ч.
Вдохновлённый S.T.A.L.K.E.R. кооперативный шутер Misery вернулся в Steam — разработчики уладили конфликт с GSC Game World 14 ч.
Амбициозный симулятор жизни Paralives не выйдет 8 декабря в раннем доступе Steam — объявлена новая дата релиза 16 ч.
Биткоин упал ниже $95 000 на фоне снижения акций криптобирж и технологических компаний 17 ч.
Google предложила Еврокомиссии поменять подход к рекламе вместо продажи активов 17 ч.
Google потратит на строительство трёх новых ЦОД в Техасе $40 млрд 5 ч.
В Китае замечен прототип обновлённого электромобиля Xiaomi SU7 6 ч.
В следующем году Samsung намеревается продать 7 млн складных смартфонов 6 ч.
Авоська для Apple iPhone за $230 была распродана за считанные часы 7 ч.
Доля трафика ChatGPT начинает сокращаться на фоне роста популярности Gemini 12 ч.
Retro Games выпустила THEA1200 — полноразмерную реплику культового Amiga 1200 за €190 12 ч.
Европейский Очень большой телескоп в Чили увеличил чувствительность в десять раз — удивительные находки не заставят себя ждать 14 ч.
Распахните небо! У вас накурено: выбросы CO₂ от сжигания ископаемого топилва установили новый рекорд 14 ч.
Asus представила GeForce RTX 5060 и RTX 5060 Ti Dual Evo с короткими печатными платами и сдвинутым разъёмом питания 15 ч.
MSI представила плату PRO B840M-P EVO WIFI6E PZ начального уровня с разъёмами питания на обратной стороне 16 ч.