|
Опрос
|
реклама
Быстрый переход
OpenAI представила ИИ-агента Aardvark для поиска и устранения уязвимостей в ПО
31.10.2025 [14:50],
Николай Хижняк
Компания OpenAI представила Aardvark — исследовательского ИИ-агента на базе GPT‑5 для поиска уязвимостей в программном обеспечении.
Источник изображений: OpenAI OpenAI отмечает, что каждый год в корпоративных и открытых кодовых базах обнаруживаются десятки тысяч новых уязвимостей. Эксперты сталкиваются с непростой задачей поиска и устранения уязвимостей раньше, чем это сделают злоумышленники. Aardvark представляет собой прорыв в исследованиях ИИ и безопасности. Это автономный агент, который может помочь разработчикам и командам безопасности обнаруживать и устранять уязвимости безопасности в больших масштабах. Aardvark постоянно анализирует репозитории исходного кода для выявления уязвимостей, оценки возможности их эксплуатации, определения степени серьёзности и предложения целевых исправлений. Он отслеживает коммиты и изменения в кодовых базах, выявляет уязвимости, определяет, как они могут быть использованы, и предлагает решения. Aardvark не использует традиционные методы анализа программ, такие как фаззинг или анализ композиции программного обеспечения. Вместо этого он использует рассуждения на основе LLM, а также инструменты для понимания поведения кода и выявления уязвимостей. Aardvark ищет ошибки так же, как это делает исследователь безопасности: читая код, анализируя его, создавая и запуская тесты, используя инструменты и многое другое. ![]() Aardvark использует многоступенчатый конвейер для выявления, объяснения и устранения уязвимостей:
Хотя Aardvark создан для обеспечения безопасности, OpenAI в ходе тестирования обнаружила, что агентный ИИ также может выявлять выявлять логические ошибки, неполные исправления и проблемы с конфиденциальностью. Aardvark уже несколько месяцев непрерывно работает с внутренними кодовыми базами OpenAI и кодовыми базами внешних партнёров. В OpenAI он выявил серьёзные уязвимости и внёс вклад в повышение безопасности ПО. В ходе бенчмарк-тестирования на «золотых» репозиториях Aardvark выявил 92 % известных и искусственно созданных уязвимостей, продемонстрировав высокую полноту и эффективность в реальных условиях. Aardvark также применялся к проектам с открытым исходным кодом, где он обнаружил многочисленные уязвимости, десяти из которых были присвоены идентификаторы Common Vulnerabilities and Exposures (CVE). OpenAI отмечает, что собирается предлагать бесплатное сканирование избранных некоммерческих репозиториев с открытым исходным кодом, чтобы внести свой вклад в безопасность экосистемы программного обеспечения с открытым исходным кодом и цепочки поставок. Недавно компания обновила свою политику скоординированного раскрытия информации, которая ориентирована на разработчиков, сотрудничество и масштабируемость воздействия, а не на жёсткие сроки раскрытия информации, которые могут оказывать давление на разработчиков. Сейчас Aardvark доступен в закрытой бета-версии для проверки и улучшения своих возможностей в реальных условиях. OpenAI приглашает избранных партнёров присоединиться для получения раннего доступа и совместной работе напрямую с командой OpenAI над улучшением точности обнаружения, рабочих процессов валидации и качества отчётности. «Алиса AI» получила ИИ-агентов, которые бронируют услуги, ищут скидки и проводят исследования по заданию пользователя
28.10.2025 [16:07],
Павел Котов
«Яндекс» открыл предварительную запись на доступ к агентам искусственного интеллекта службы «Алиса AI». ИИ-агенты, как называются прикладные программы для ИИ, смогут от имени пользователей бронировать столики в ресторанах или места в салонах красоты, находить товары по минимальным ценам и самостоятельно проводить глубокие исследования с поиском информации и обработкой результата.
Источник изображений: yandex.ru/company Бронировать места в салонах красоты, барбершопах и других заведениях можно будет прямо в переписке с чат-ботом «Алиса AI». Виртуальный помощник понимает не только строго сформулированные, но и выраженные естественным языком инструкции, такие как: «Забронируй на 19 часов стол для 4 человек в ресторане с римской пиццей на „Парке Культуры“» или «Запиши меня на женскую стрижку на завтра в 10 часов в тот же салон, что и в прошлый раз». ИИ изучит историю записей и самостоятельно найдёт свободные места или столики в нужном заведении — либо предложит альтернативные решения, если нужное заведение недоступно, или в нём всё занято. ИИ-помощник работает с 30 тысячами ресторанов и 40 тысячами других заведений, включая салоны красоты. ![]() Ещё один ИИ-агент «Алисы AI» поможет в поиске товаров по выгодным ценам. Пользователю достаточно отправить в чат ссылку на искомый товар, чтобы ИИ изучил огромное количество предложений и подобрал наиболее выгодные из них. ИИ-агента также можно запустить по нажатии на кнопку «Найти дешевле» в «Яндекс Браузере» или «Найти скидку» в поисковой службе. Некоторые товары будут продаваться с индивидуальной скидкой от «Алисы AI», доступной только в чате. В переписке можно будет и оформлять заказы из некоторых магазинов без лишних действий, прямо в один клик. Третий мощный ИИ-агент предназначен для проведений глубоких исследований, которые требуют изучения большого количества сайтов или документов. «Алиса AI» выступает в качестве эксперта-аналитика, способного разобраться с широким спектром вопросов — это может быть планирование ремонта, анализ рынка или сфера личных финансов. При необходимости «Алиса AI» напишет программный код и сама его выполнит. Все эти функции сейчас работают в режиме предварительного доступа — чтобы начать работу с ними, придётся зарегистрироваться в списке ожидания. Живые и цифровые люди в будущем будут работать бок о бок, убеждён Дженсен Хуанг
22.10.2025 [13:04],
Алексей Разин
Как основатель одной из компаний, находящихся в эпицентре бума искусственного интеллекта, глава Nvidia Дженсен Хуанг (Jensen Huang) постоянно делится своими соображениями по поводу будущего отрасли. Недавно он заявил, что живые люди смогут работать бок о бок с «цифровыми людьми», как он называет отвечающих за взаимодействие с искусственным интеллектом агентов.
Источник изображения: Nvidia Эти заявления генеральный директор Nvidia Дженсен Хуанг, как отмечает ITPro, сделал на конференции Future of Global Markets, которая проводилась по инициативе Citadel Securities. Рынок труда в будущем существенно изменится, по словам основателя Nvidia, и новейший прогресс в создании агентского ИИ указывает на это. По его словам, компании смогут под решение конкретных задач формировать своего рода штат виртуальных специалистов, которые будут использовать ресурсы систем искусственного интеллекта для выполнения рутинной работы. При этом сотрудники из плоти и крови никуда не денутся и не отойдут на второй план. «Я не удивлюсь, если вы лицензируете и наймёте некоторое количество ИИ-агентов, в зависимости от качества и глубины экспертизы. Таким образом, в будущем рабочая сила предприятия будет являться комбинацией людей и цифровых людей», — заявил Дженсен Хуанг. Эти ИИ-агенты будут предоставляться ведущими разработчиками систем искусственного интеллекта. Глава компании перечислил провайдеров подобной «виртуальной рабочей силы»: Replit, Cursor и Lovable уже предлагают услуги ИИ-агентов для разработки программного обеспечения. Прочие руководители компаний отрасли тоже склоняются к идее, что людям придётся сосуществовать на рынке труда с ИИ, и полного замещения человека в большинстве профессий не произойдёт. Подобной точки зрения, например, придерживается и глава Salesforce Марк Бениофф (Marc Benioff). Непосредственно сотрудники компаний отрасли постепенно начинают смягчать свою позицию относительно перспектив сосуществования с ИИ-агентами. Опрос Workday показал, что 75 % сотрудников вполне комфортно относятся к идее работы вместе с ИИ-агентами, но лишь 30 % респондентов выразили готовность подчиняться им. Ещё 12 % участников опроса выразили категорическое неодобрение идеи подчинения ИИ-агентам с точки зрения психологического комфорта. Как отмечает Хуанг, процесс поиска сотрудников в среде ИИ-агентов мало чем будет отличаться от обычного. Кадровые структуры компаний должны быть готовы к тому, что им придётся иметь дело с «цифровыми сотрудниками» в будущем, убеждён глава Nvidia. В самой этой компании подобное будущее наступит неизбежно, по мнению её основателя. В определённых сферах деятельности применение ИИ-агентов имеет смысл и с точки зрения обеспечения конфиденциальности. Например, кибербезопасность является тем направлением деятельности Nvidia, где количество ИИ-агентов уже превышает штат живых сотрудников. Впрочем, и в сфере разработки чипов или ПО компания также активно применяет ИИ-помощников. «В данный момент в Nvidia 100 % наших разработчиков ПО, 100 % наших разработчиков чипов, каждый инженер в компании имеет помощника Cursor», — признался глава Nvidia, имея в виду провайдера ИИ-агентов. Пройдёт не менее десяти лет, прежде чем ИИ-агенты действительно начнут работать — Андрей Карпатый
20.10.2025 [13:11],
Алексей Разин
Выступая в одном из подкастов на прошлой неделе, один из основателей OpenAI Андрей Карпатый (Andrej Karpathy) признался, что функциональные ИИ-агенты начнут реально работать примерно через десять лет. Стремительное развитие ИИ само по себе не гарантирует быстрых результатов, и участникам рынка, а также пользователям необходимо запастись терпением.
Источник изображения: Gerd Altmann / pixabay.com В современном состоянии ИИ-агенты, по словам Карпатого, весьма далеки от совершенства: «Они просто не работают. Они недостаточно умны, недостаточно мультимодальны, они не могут использовать компьютер и делать прочие вещи. Они не могут обучаться непрерывно. Вы не можете просто сказать им что-то, чтобы они это запомнили. Они отстают в когнитивных способностях, и это просто не работает». По мнению сооснователя OpenAI, пройдёт не менее десяти лет, прежде чем все эти недостатки будут устранены. Агенты являются одной из самых обсуждаемых тем в сфере искусственного интеллекта, подчёркивает Business Insider. Многие инвесторы называют текущий год «годом агента». В общем случае, под агентом подразумевается виртуальный помощник, способный самостоятельно выполнять задания: анализировать сложные проблемы, составлять планы и предпринимать действия без дополнительного взаимодействия с пользователем. Карпатый на страницах социальной сети X добавил, что его критика отрасли вызвана стремлением преувеличить возможности имеющихся инструментов относительно реальности. «Отрасль живёт в будущем, в котором полностью автономные сущности параллельно взаимодействуют друг с другом для написания кода, а люди при этом бесполезны», — заявил один из основателей OpenAI. Он, по его собственному признанию, в такой реальности жить не готов, поскольку считает, что люди и ИИ должны содействовать друг другу при написании программного кода и выполнении заданий. Если описать комментарии Карпатого простыми словами, он хотел бы иметь возможность убедиться, что ИИ создаёт корректный программный код, не слишком увлекаясь допущениями и во всех сложных случаях советуется с человеком. Последний должен расти в профессиональном плане и совершенствоваться вместе с ИИ, а не довольствоваться ролью поддержания в работоспособном состоянии «гор кода», отметил Карпатый. Он также заявил, что проблема при создании не требующих вмешательства человека агентов заключается в том, что низкопробный контент, генерируемый ИИ, становится повсеместным, а люди — бесполезными. Прочие представители отрасли также выражают озабоченность стремлением некоторых пользователей слишком сильно полагаться на ИИ. По словам директора по развитию ScaleAI Квинтина Ау (Quintin Au), большие языковые модели сейчас при выполнении одного действия с вероятностью 20 % совершают ошибку. Если агенту требуется выполнить пять действий в рамках одного задания, шансы на корректное выполнение каждого не превышают 32 %. Андрей Карпатый при этом призывает не считать его ИИ-скептиком. По его словам, его внутренние графики в пять или десять раз пессимистичнее самых амбициозных комментариев представителей отрасли, но они всё равно более оптимистичны по сравнению с экспертами, полностью отрицающими ИИ. Хакеры слили данные сотен сотрудников ФБР, Минюста и Министерства внутренней безопасности США
17.10.2025 [18:13],
Сергей Сурабекянц
Группа Scattered LAPSUS$ Hunters из хакерского сообщества Com, стоящего за крупными утечками данных в последние годы, опубликовала имена и личные данные сотен государственных служащих, включая сотрудников ФБР, Министерства юстиции США, Министерства внутренней безопасности США, Иммиграционной и таможенной полиции США. Хакеры публично обратились к мексиканским наркокартелям, требуя вознаграждения за доксинг (раскрытие персональных данных) агентов США.
Источник изображения: unsplash.com «Я хочу свои деньги, Мексика», — написал пользователь Telegram-канала Scattered LAPSUS$ Hunters, объединяющего несколько хакерских групп, связанных с киберпреступным сообществом Com. «Мексиканские картели, мы сбрасываем все документы, где мой миллион долларов?» — говорится в другом сообщении. Хакеры имеют в виду заявление Министерства внутренней безопасности США о том, что мексиканские картели начали предлагать вознаграждение за доксинг агентов. Правительство США не подтвердило и не опровергло это утверждение, несмотря на угрозы хакеров в следующий раз раскрыть данные работников налогового управления. Издание 404 Media изучило несколько таблиц с данными, опубликованных в Telegram-канале группы. Одна содержала якобы персональные данные 680 сотрудников Министерства внутренней безопасности, другая — сведения о более чем 170 адресах электронной почты ФБР и их владельцах; а третья — персональные данные более 190 сотрудников Министерства юстиции. При содействии компании District 4 Labs, специализирующейся на кибербезопасности, сотрудники 404 Media подтвердили достоверность некоторых опубликованных данных. Исследование показало, что многие части документов действительно относились к государственным служащим с тем же именем, названием агентства, адресом или номером телефона. В некоторых случаях адреса, опубликованные хакерами, по-видимому, относились к жилым, а не к офисным помещениям. Неясно, как хакеры собрали или иным образом получили эти данные, будь то объединение предыдущих разрозненных утечек данных или получение их из конкретного государственного органа. Министерство внутренней безопасности заявило, что его чиновники «сталкиваются с более чем 1000 % ростом числа нападений на них и их семьи, подвергающихся доксингу и угрозам в интернете». Остаётся неясным, как именно Министерство рассчитало этот рост и какие данные использовало. Правительство США принимает меры в отношении приложений, веб-сайтов и страниц в социальных сетях, которые, по его мнению, раскрывают персональную информацию или иным образом угрожают государственным служащим. Во многих случаях эти источники информации действовали в соответствии с первой поправкой к Конституции США и не занимались доксингом, но всё равно вынуждены были подчиниться. Так, Apple была вынуждена удалить приложение Eyes Up, которое собирало видеозаписи действий и злоупотреблений иммиграционных и таможенных служащих. Также Apple пришлось запретить ряд приложений, которые демонстрировали незаконные действия государственных чиновников, после прямого давления со стороны Министерства юстиции. Хакерская группа Scattered LAPSUS$ Hunters приобрела известность после угрозы опубликовать большой объём данных клиентов Salesforce, включая Disney/Hulu, FedEx, Toyota, UPS и других. В 2016 году другая хакерская группа под названием Crackas With Attitude опубликовала личные данные около 20 000 агентов ФБР и 9000 сотрудников Министерства внутренней безопасности. Учёные Apple представили три проекта для ИИ-программирования: обучение, поиск багов и тестирование
17.10.2025 [14:01],
Павел Котов
Apple опубликовала три статьи, посвящённые исследованиям в области искусственного интеллекта. Учёные компании предложили новые подходы для поиска ошибок в коде, для тестирования созданных ИИ программных решений и для обучения моделей и агентов, способных создавать работающий код.
Источник изображения: Milad Fakurian / unsplash.com Первое исследование посвящено модели, которую в Apple назвали ADE-QVAET. Она призвана решить проблемы, свойственные традиционным современным моделям ИИ, такие как галлюцинации, выпадение модели из контекста при анализе кодовой базы большого объёма, а также утеря связи с фактической бизнес-логикой применительно к текущему программному решению. ADE-QVAET призвана повысить точность прогнозирования ошибок посредством объединения четырёх методов ИИ: адаптивная дифференциальная эволюция (Adaptive Differential Evolution — ADE), квантовый вариационный автокодировщик (Quantum Variational Autoencoder — QVAE), архитектура трансформера, а также адаптивное шумоподавление и дополнение (Adaptive Noise Reduction and Augmentation — ANRA). ADE выступает как альтернативный механизм обучения модели, QVAE способствует более глубокому обнаружению закономерностей в данных, трансформер помогает отслеживать связи этих закономерностей, а ANRA обеспечивает очистку и баланс данных, чтобы результаты работы ИИ были согласованными. При этом в отличие от большой языковой эта модель не проводит прямого анализа кода — она оценивает его сложность, размер и структуру и ищет закономерности, которые могут указывать на места, где вероятно возникновение ошибок. Обучив модель на 90 % данных исходного массива, исследователи установили, что точность прогнозов ADE-QVAET составляет от 95 % до 98 %. Это значит, что модель демонстрирует высокую надёжность и высокую эффективность в выявлении действительных ошибок и почти не даёт ложных срабатываний. Второе исследование, которое провели преимущественно авторы первого, призвано сформировать средства для планирования и создания инструментов тестирования крупных программных проектов. Учёные построили систему Agentic RAG (Retrieval-Augmented Generation) из большой языковой модели и ИИ-агентов, которая самостоятельно планирует, пишет и организовывает тестирование ПО, облегчая работу инженерам по качеству — эти задачи занимают у них от 30 % до 40 % рабочего времени, указывают авторы исследования.
Источник изображения: Igor Omilaev / unsplash.com Подключение нескольких агентов к ИИ-модели с RAG помогло повысить точность тестирования ПО с 65 %, которые демонстрировала прежняя модель с RAG, работавшая без агентов, до 94,8 % у модели с ИИ-агентами. На 85 % сократилось время тестирования ПО, на те же 85 % повысилась точность средств тестирования, а прогнозируемая экономия средств составила 35 %. Новая система позволила сократить сроки ввода программных решений в эксплуатацию на два месяца. Единственное ограничение предложенной Apple системы Agentic RAG состоит в том, что испытывали её на сложных корпоративных кадровых и бухгалтерских системах, а также средствах SAP. Третий проект получил название SWE-Gym — его задача не прогнозировать ошибки и не тестировать ПО — это механизм обучения ИИ-агентов. Обучаясь на чтении, редактировании и проверке реально существующего программного кода, эти агенты обретают способность исправлять в нём ошибки. Платформу SWE-Gym построили на основе 2438 реальных задач на языке Python из 11 открытых репозиториев — в каждом из них были исполняемая среда и набор тестов, благодаря которым ИИ-агенты имели возможность практиковаться в написании и отладке кода в реалистичных условиях. Авторы исследования также создали платформу SWE-Gym Lite на базе 230 более простых задач, которая помогает ускорить обучение и снизить затраты на вычислительные ресурсы. Обученные с помощью средств SWE-Gym агенты правильно решили 72,5 % предложенных задач, то есть платформа помогла повысить качество их работы на 20 процентных пунктов по сравнению с предыдущими методами. В случае с SWE-Gym Lite время обучения сокращается вдвое, если сравнивать с полномасштабной платформой, но обученные на облегчённом варианте агенты предназначаются для работы с более простыми задачами. «Огромное влияние в огромных масштабах»: Илон Маск рассказал о Macrohard — будущем конкуренте Microsoft
15.10.2025 [16:11],
Владимир Мироненко
Илон Маск (Elon Musk), возглавляющий компании Tesla, SpaceX, сервис X и стартап xAI, сообщил некоторые подробности о проекте Macrohard, который может стать прямым конкурентом Microsoft.
Источник изображения: X Компания Macrohard была зарегистрирована Маском в августе текущего года, а за несколько недель до этого в Патентном бюро США был зарегистрирован одноимённый товарный знак. «Проект @xAI Macrohard окажет огромное влияние в огромных масштабах», — сообщил Маск в соцсети X, добавив, что цель заключается в том, чтобы создать компанию, которая «сможет заниматься всем, кроме непосредственного производства физических объектов, но сможет делать это косвенно, подобно тому, как другие организации производят для Apple собственные продукты». Такое позиционирование новой компании свидетельствует о комплексном вызове компании Microsoft на уровне платформы, а не о каком-то одном приложении или сервисе. Согласно описанию Маска, xAI будет определять операционную систему, референсные проекты и требования к продукту, в то время как разработка устройств будет передана на аутсорсинг третьей стороне, подобно бизнес-модели Apple. Также рассматривается вариант лицензирования, аналогично Windows, при котором OEM-партнёры смогут использовать ПО Macrohard/xAI для создания более широкой экосистемы мультибрендовых устройств. В связи с этим следует ожидать выхода базовой операционной системы, адаптированной для агентов и сервисов искусственного интеллекта. По словам Маска, агенты xAI предназначены для написания и постоянного совершенствования ПО промышленного уровня, включая игры, для чего будут использоваться значительные вычислительные мощности, в том числе действующий кластер Colossus 1 и строящийся Colossus 2. Ближайшие цели xAI включают выпуск до конца 2026 года «отличной игры, созданной с помощью ИИ». Создание платформы подразумевает выпуск собственных инструментов и комплектов разработчика в будущем. Судя по опубликованным вакансиям, в проекте также участвует небольшая команда специалистов «на стороне», хотя основная нагрузка лежит на сотрудниках и инфраструктуре xAI. Google представила модель Gemini, которая заполняет в браузере формы и играет в 2048
08.10.2025 [06:24],
Анжелла Марина
Компания Google представила предварительную версию новой ИИ-модели Gemini 2.5 с функцией Computer Use, которая способна взаимодействовать с веб-сайтами через браузер, имитируя действия человека. Модель применяет визуальное понимание и логическое рассуждение для выполнения, например, таких задач, как заполнение и отправка форм без использования API или другого программного интерфейса.
Источник изображения: Solen Feyissa/Unsplash Как сообщает The Verge, модель Gemini 2.5 Computer Use предназначена для работы с пользовательскими интерфейсами, созданными для людей, а не для автоматизированных систем. По заявлению Google, технология уже применялась в агентских функциях AI Mode и в исследовательском прототипе Project Mariner, где ИИ-агенты самостоятельно выполняли задачи в браузере, например, добавляли товары в корзину на основе списка ингредиентов. Интересно, что анонс новой модели состоялся спустя день после того, как OpenAI представила новые приложения для ChatGPT в рамках ежегодного мероприятия Dev Day, продолжив развитие функции ChatGPT Agent, способной выполнять сложные задачи от имени пользователя. При этом Anthropic ещё в прошлом году выпустила версию модели Claude с функцией Computer Use. Однако Google заявляет, что её модель «превосходит ведущие аналоги по нескольким веб- и мобильным бенчмаркам». В отличие от ChatGPT Agent и инструмента Anthropic, Gemini 2.5 Computer Use имеет доступ только к браузеру, а не ко всей операционной системе. Google подчеркнула, что решение «пока не оптимизировано для управления на уровне настольной ОС» и поддерживает 13 действий, включая открытие веб-браузера, ввод текста, а также перетаскивание элементов. Сообщается, что модель уже доступна разработчикам через платформы Google AI Studio и Vertex AI. Кроме того, публичная демонстрация размещена в виртуальном браузере BrowserBase, где можно наблюдать, как ИИ выполняет такие задачи, как «сыграть в игру 2048» или «просмотреть Hacker News в поисках обсуждаемых тем». OpenAI не исключает появления рекламы в ChatGPT Pulse в будущем
07.10.2025 [11:26],
Владимир Мироненко
Генеральный директор OpenAI Сэм Альтман (Sam Altman) на встрече с журналистами на мероприятии DevDay в Сан-Франциско (США) не исключил возможность добавления в будущем рекламы при использовании новой функции ChatGPT Pulse, которая сейчас доступна только подписчикам тарифа ChatGPT Pro.
Источник изображения: OpenAI ChatGPT Pulse — это новейшая разработка OpenAI в области персонализации для ChatGPT, которая была представлена в конце прошлого месяца. Эта функция позволяет чат-боту получать информацию о пользователе из его подключённых приложений, например, календаря и электронной почты, активности в интернете, переписки и т.д., чтобы затем собирать в Сети информацию от его имени и каждое утро предоставлять сводку по различным темам, которым могут представлять для него интерес. Это может быть ежедневная персонализированная программа тренировок, уроки языка, обзоры новостей или рекомендации по заказу в ресторане, куда он собирается вечером. Одним словом, OpenAI хотела бы, чтобы пользователи каждый день начинали с ChatGPT. В компании признали, что вопрос добавления рекламы в Pulse обсуждается, но, по словам Альтамана, таких планов в настоящее время нет. Вместе с тем он отметил, что ему нравится реклама в Instagram✴, и не исключил возможности внедрения подобной релевантной рекламы в Pulse в будущем. Изначально при разработке Pulse предполагалось сделать эту функцию доступной для всех, но из-за высокой вычислительной нагрузки приложения было решено предложить её только для участников платной подписки Pro. OpenAI сделала общедоступным Codex — ИИ-алгоритм с динамическим мышлением для агентского программирования
07.10.2025 [04:37],
Владимир Фетисов
В прошлом месяце OpenAI представила обновлённого ИИ-агента GPT-5-Codex, способного динамически распределять время на выполнение задач. На тот момент он был доступен подписчикам ChatGPT Plus, Pro, Business, Education и Enterprise. Теперь же алгоритм получает ряд полезных нововведений и становится общедоступным.
Источник изображения: AI Разработчики интегрировали Codex в сервис совместной работы Slack. Благодаря этому пользователи смогут делегировать задачи и задавать вопросы ИИ-агенту прямо в канале команды или ветке обсуждения, подобно тому, как происходит общение между коллегами. Вместе с этим Open AI выпустила Codex SDK, благодаря которому ИИ-агента можно будет встроить в продукты сторонней разработки. Ещё одним нововведением стало появление дополнительных инструментов администрирования, которые обеспечат больше контроля над средами разработки. Администраторы смогут редактировать и удалять облачные среды Codex внутри своего рабочего пространства. Появится возможность применения настроек с повышенным уровнем безопасности по умолчанию для локального использования через терминал и расширение для IDE. Новые аналитические панели помогут администраторам отслеживать разные параметры в процессе взаимодействия пользователей с ИИ-агентом. Теперь пользователи могут взаимодействовать с Codex практически в любом месте, где они занимаются написанием программного кода, будь то какой-то редактор или облако, и всё это связано в рамках одной учётной записи ChatGPT. По данным OpenAI, уровень ежедневного использования ИИ-агента вырос более чем в 10 раз с начала августа. Отмечается, что GPT-5-Codex вошла в число самых быстрорастущих ИИ-моделей компании. С её помощью было обработано свыше 40 трлн токенов за три недели с момента запуска. Codex используется разработчиками по всему миру, а в OpenAI он уже стал неотъемлемой частью процесса разработки. Интеграция ИИ-агента в Slack и Codex SDK доступны разработчикам в рамках тарифных планов ChatGPT Plus, Pro, Business, Edu и Enterprise, начиная с этой недели. Новые функции администрирования смогут опробовать подписчики Business, Edu и Enterprise. Более детальную информацию касательно разграничений доступа в зависимости от используемого тарифа можно получить на сайте OpenAI. OpenAI запустила AgentKit — инструмент для создания ИИ-агентов за считанные минуты
07.10.2025 [00:23],
Анжелла Марина
Компания OpenAI представила на мероприятии для разработчиков Dev Day новый инструмент AgentKit, предназначенный для упрощения разработки и развёртывания ИИ-агентов для задач разного уровня сложности. Как заявил глава компании Сэм Альтман (Sam Altman), AgentKit представляет собой единый комплект компонентов в одном интерфейсе платформы OpenAI, который поможет быстрее создавать и оптимизировать автономных пользовательских агентов.
Источник изображения: OpenAI Инструментарий включает несколько важных модулей, сообщается в блоге OpenAI. Первый — Agent Builder, который Альтман охарактеризовал как «Canva для создания агентов». Он обеспечивает быстрый визуальный способ проектирования логики, шагов и идей и построен на базе Responses API, уже используемого сегодня многими разработчиками. Второй модуль называется ChatKit. Он предоставляет простой встраиваемый чат-интерфейс, который разработчики могут интегрировать в собственные приложения. Его также можно размещать на веб-сайтах и настраивать в соответствии с тематикой продукта или брендом компании. Третий модуль, под названием Evals for Agents, измеряет производительность ИИ-агента и оценивает как его поведение в целом, так и отдельные компоненты в соответствии с множеством наборов данных для анализа. AgentKit также предоставляет доступ к реестру коннекторов OpenAI, позволяя разработчикам безопасно подключать агентов к внутренним инструментам и сторонним системам через «панель администрирования», сохраняя при этом контроль и безопасность. В подтверждение простоты использования инструмента инженер OpenAI Кристина Хуан (Christina Huang) в прямом эфире на сцене Dev Day создала полноценный рабочий процесс и двух ИИ-агентов менее чем за восемь минут. Альтман добавил, что AgentKit включает всё то, чего не хватало команде OpenAI при создании первых собственных агентов, и сообщил, что компания уже заключила контракты с рядом партнёров, которые начали внедрять и масштабировать использование агентов с помощью нового инструмента. Google представила ИИ-агента CodeMender — он самостоятельно устраняет уязвимости ПО
06.10.2025 [21:02],
Анжелла Марина
Лаборатория Google DeepMind опубликовала результаты работы агента на базе искусственного интеллекта CodeMender. Агент может в автономном режиме выявлять, исправлять и переписывать уязвимый код для предотвращения будущих эксплойтов в программном обеспечении.
Источник изображения: Google Как пишет издание SiliconANGLE, CodeMender развивает предыдущие проекты DeepMind по поиску уязвимостей, в частности проект OSS-Fuzz для анализа безопасности открытого ПО и систему Big Sleep, сочетая интеллектуальные возможности моделей Gemini с передовыми методами программного анализа. Основной целью проекта является автономная отладка и исправление сложных ошибок в крупномасштабных кодовых базах. Несмотря на то что проект находится на стадии исследований, CodeMender уже отправил 72 исправления безопасности в проекты с открытым исходным кодом, включая те, объём которых превышает 4,5 миллиона строк кода. По данным компании, ИИ-агент позволяет разработчикам сосредоточиться на создании качественного программного обеспечения, автоматически генерируя и применяя надёжные патчи безопасности. Система спроектирована как для реактивной, так и для проактивной работы: она не только мгновенно исправляет обнаруженные уязвимости, но и переписывает существующий код, устраняя целые классы ошибок. В качестве примера исследователи DeepMind приводят работу агента с библиотекой сжатия изображений libwebp, которая была использована в атаке на iOS в 2023 году. Агент применил к ней аннотации -fbounds-safety, после чего, по заявлению исследователей, подобные уязвимости переполнения буфера стали «невозможными для эксплуатации навсегда». Внутренняя архитектура CodeMender включает набор инструментов: статический и динамический анализ, фаззинг, символьное исполнение и так называемого «судью LLM», который проверяет, сохраняют ли предлагаемые изменения исходную функциональность. Система способна к самокоррекции, если в процессе проверки обнаруживается проблема. Все изменения перед отправкой проходят проверку на корректность, соответствие стилевым стандартам и отсутствие регрессий. При этом в DeepMind подчёркивают, что CodeMender пока остаётся исследовательским проектом, и все патчи, сгенерированные им, проходят проверку исследователями-людьми перед отправкой в проекты. После запуска инструмент будет предлагать иной подход по сравнению с традиционными методами, такими как статический анализ и фаззинг, которые находят уязвимости, но всё ещё сильно зависят от опыта проверяющего человека. Новый подход изменит систему, в которой искусственный интеллект сможет самостоятельно выявлять и устранять ошибки, что является критически важным шагом по мере экспоненциального роста размера и сложности современных кодовых баз. Microsoft добавила «вайб-воркинг» в Office — ИИ-агента для создания сложных документов и таблиц по указаниям пользователя
30.09.2025 [12:36],
Павел Котов
Microsoft запустила в Excel и Word режим агента с искусственным интеллектом (Agent Mode), позволяющий автоматически создавать по одному текстовому запросу сложные электронные таблицы и текстовые документы. В чате Copilot также дебютировала функция Office Agent, работающая на основе моделей Anthropic — она позволяет быстро создавать презентации PowerPoint и документы Word.
Источник изображений: microsoft.com Режим агента в Excel и Word — это более мощный вариант помощника Copilot, который уже присутствует в программах офисного пакета. Одна из задач агента состоит в том, чтобы сделать доступными для пользователей сложные функции Excel. ИИ-агент работает на базе модели OpenAI GPT-5. Получив сложную задачу, он разбивает её на этапы, составляет план и пояснения к нему, позволяя пользователю следить за своей работой. Каждый этап он, в свою очередь, делит на конкретные задачи, и каждое действие агента отображается на боковой панели. ИИ-агент в Excel набрал 57,2 % в тесте SpreadsheetBench, предназначенном специально для оценки способности моделей редактировать электронные таблицы. Это выше, чем показали Shortcut.ai, агент ChatGPT и Anthropic Claude Files Opus 4.1, но ниже результата человека, у которого 71,3 %. Режим агента в Word — это не просто редактирование и составление сводок текста. Агент готовит черновики материалов, предлагает уточнения и указывает, что может понадобиться при составлении документа. Можно свести рабочие данные за несколько месяцев в единый отчёт, подвести итоги месяца и быстро установить различия с предыдущим отчётом. ![]() Office Agent на базе моделей Anthropic работает в чате Copilot вне пакета офисных приложений, но позволяет прямо в чате создавать презентации PowerPoint и документы Word. В случае PowerPoint пользователь получает презентацию с логичной структурой, при составлении которой ИИ может обращаться к источникам среди веб-ресурсов и в процессе демонстрирует предварительные версии слайдов. Примечательно, что в программах пакета Office основными выступают модели OpenAI, но всё большее место в экосистеме Microsoft занимают модели другого разработчика — Anthropic. Разработчик интегрировал Office Agent в чат Copilot, обращаясь к API Anthropic на базе Amazon Web Services — прямого конкурента Microsoft. Это, возможно, объясняет, почему глубокой интеграции моделей этого разработчика в офисном пакете пока нет. Режим ИИ-агента в Word и Excel уже доступен участникам программы тестирования экспериментальных функций Frontier — нужна подписка Microsoft 365 Copilot или Microsoft 365 Personal/Family. Пока он дебютировал только в веб-версиях приложений, но вскоре появится и в их десктопных вариантах. Office Agent тоже работает пока только для пользователей программы Frontier для подписчиков тех же Microsoft 365 Copilot и Microsoft 365 Personal/Family в США. OpenAI встроила онлайн-шоппинг в ChatGPT: покупать товары теперь можно не выходя из чата
30.09.2025 [07:42],
Алексей Разин
На рынке США компания OpenAI предложила клиентам определённых торговых площадок функцию интеграции онлайн-шоппинга в диалоговое окно своего ChatGPT, чтобы они могли находить нужные товары через чат-бот и там же совершать покупки. Этим самым OpenAI вторгается в сферу коммерческих интересов Amazon и Google, помимо прочих.
Источник изображения: Unsplash, CardMapr.nl Как отмечает TechCrunch, нововведение доступно зарегистрированным пользователям планов ChatGPT Pro, Plus и Free на территории США, которые могут покупать товары с площадок Etsy и Shopify, хотя в последнем случае поддержка нововведения пока находится в состоянии реализации. ChatGPT выступает в роли агента, готового передать платёжную информацию от покупателя продавцу в зашифрованном виде, если пользователь чат-бота определится со своим выбором и пожелает совершить покупку. Удобство заключается в том, что покупателю не нужно будет открывать отдельное окно или приложение, и сделку можно будет оформить прямо из ChatGPT. Поддерживаются платёжные системы Apple Pay, Google Pay, Stripe и банковские карты. Нельзя сказать, что OpenAI стала пионером в этой области, поскольку Perplexity подобные функции реализовала в своей экосистеме ещё в прошлом году. Microsoft также позволяет продавцам интегрировать функцию покупки товаров в Copilot. При этом OpenAI собирается открыть для разработчиков исходный код протокола ACP, который позволит им интегрировать опцию моментальной покупки через Stripe в свои программные интерфейсы. Компании Google и Amazon, которые долгое время выступали крупными агентами в сфере онлайн-торговли, теперь получат нового амбициозного конкурента. Тем более, что они также предлагают разработчикам ПО для торговых площадок протокол AP2, позволяющий интегрировать функцию покупки через ИИ-агента. Президент OpenAI: человечеству потребуется 10 млрд ИИ-ускорителей — по одному на каждого жителя Земли
30.09.2025 [06:58],
Алексей Разин
Сейчас стартап OpenAI использует любую возможность для привлечения не только финансовых ресурсов, но и заключения контрактов с поставщиками тех же ускорителей вычислений, коим является Nvidia. Президент компании Грег Брокман (Greg Brockman) убеждён, что человечеству потребуется до 10 млрд ускорителей вычислений, и каждого жителя планеты буквально будет обслуживать отдельный ИИ-чип.
Источник изображения: Nvidia Своими соображениями президент OpenAI поделился в интервью CNBC, в котором также приняли участие генеральный директор компании Сэм Альтман (Sam Altman), а также глава и основатель Nvidia Дженсен Хуанг (Jensen Huang). По мнению Альтмана, масштабы сотрудничества с Nvidia по своей значимости для человечества окажутся важнее программы доставки до Луны американских астронавтов, которую NASA реализовало в прошлом веке. Альтман видит будущее человечества с неразрывным присутствием «супермозга», созданного искусственным интеллектом и активно влияющего на повседневную жизнь людей. Брокман же считает, что ИИ будет действовать в качестве «агента, который работает на опережение, пока вы спите». Каждый работающий житель Земли, по его мнению, будет использовать ресурсы как минимум одного ускорителя вычислений при выполнении своих должностных обязанностей. «Вам действительно захочется, чтобы у каждого человека был свой собственный выделенный GPU», — охарактеризовал свой прогноз Брокман. Сейчас подобное предсказание может казаться нереалистичным, но достаточно вспомнить, что в начале девяностых годов прошлого века один из основателей Microosft Билл Гейтс (Bill Gates) указывал на неизбежность появления компьютера не только в каждом домохозяйстве, но и на каждом рабочем столе. В какой-то мере его предсказание сбылось, пусть даже если вместо компьютеров в их классической форме речь идёт о смартфонах, которые помещаются в карман. Брокман считает, что сейчас отрасль ИИ на три порядка отстаёт от потенциальных потребностей в вычислительных мощностях, и для создания постоянно функционирующей глобальной системы искусственного интеллекта человечеству может потребоваться до 10 млрд ускорителей вычислений. По сути, это даже больше, чем проживает людей на Земле (8,2 млрд человек). Мир, по мнению Брокмана, движется к состоянию, при котором экономику подпитывают вычисления. Вычислительных мощностей сейчас не хватает, как он считает, а наличие достаточно мощных центров обработки данных в будущем станет определять состоятельность экономики целых стран. В какой-то мере они заменят валюту в качестве источника ресурсов для развития экономики. |
|
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |