Сегодня 08 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → deepmind
Быстрый переход

Google DeepMind будет обучать ИИ в космической песочнице EVE Online

Google DeepMind, исследовательская лаборатория в области искусственного интеллекта (входит в холдинг Alphabet), приобрела миноритарную долю в разработчике популярного научно-фантастического симулятора EVE Online, планируя использовать игру для изучения «искусственного интеллекта в сложных, динамичных, управляемых игроками системах».

 Источник изображения: eveonline.com

Источник изображения: eveonline.com

Как сообщает Ars Technica, соглашение о партнёрстве в области исследований было заключено после того, как разработчик EVE Online, компания CCP Games выкупила свою долю у бывших владельцев из южнокорейского издательства Pearl Abyss (Crimson Desert), чтобы далее работать в качестве независимой компании под новым брендом Fenris Creations.

DeepMind и Fenris Creations указали в совместном заявлении, что EVE Online представляет собой «уникально богатую среду для исследований», особенно, когда речь идёт о разработке систем ИИ, использующих «долгосрочное планирование, память и непрерывное обучение». DeepMind сообщила, что проведёт контролируемые эксперименты со своими моделями в специально разработанной офлайн-версии игры, работающей на локальном сервере, без прямого влияния на игровой процесс для онлайн-игроков. Обе компании «также изучат новые игровые возможности, которые станут доступны благодаря этим технологиям».

Google DeepMind и ранее использовала игры для проверки моделей машинного обучения, такие, как Го, Atari VCS и StarCraft. В последнее время компания использует модели «виртуального мира» для обучения ИИ-систем работе в физической реальности.

По словам гендиректора Fenris, изучение EVE позволит моделям Google DeepMind исследовать «сложные проблемы, длительные временные рамки и новые возможности».

Google может столкнуться с забастовками ИИ-разработчиков из-за контрактов с военными

Сотрудники штаб-квартиры Google DeepMind в Лондоне проголосовали за создание профсоюза с целью предотвращения использования технологий компании военными структурами США и Израиля. В обращении к руководству работники поставили вопрос об официальном признании представителей профсоюзов Communication Workers Union (CWU) и Unite the Union, получив подавляющую поддержку внутри коллектива.

 Источник изображения: AI

Источник изображения: AI

Инициативу поддержали 98 % членов CWU, работающих в DeepMind. В случае успеха создание профсоюза обеспечит представительство интересов как минимум 1000 сотрудников лондонской штаб-квартиры. Как стало известно The Verge, у руководства Google есть 10 рабочих дней на добровольное признание нового органа, прежде чем будут запущены официальные юридические процедуры для принудительного признания.

В своём заявлении сотрудники выразили нежелание быть причастными к нарушениям международного права, отметив, что технологии ИИ уже используются в ходе военных действий Израиля. По их словам, даже применение разработок в административных целях делает эти операции более дешёвыми, быстрыми и эффективными, что должно быть немедленно прекращено. Помимо этого, профсоюз выдвинул конкретные требования, включая отказ от разработки оружия, технологий слежки и контрактов, наносящих вред людям. Работники также добиваются права отказа от проектов, нарушающих их личные моральные или этические устои.

В рамках широкой кампании против военных контрактов сотрудники DeepMind по всему миру рассматривают возможность проведения очных протестов и забастовок. В случае таких акций они планируют приостановить работу над улучшением сервисов Google AI, включая ассистента Gemini. Как отмечает The Verge, это решение назревало на фоне растущего недовольства внутри компании, например, неделей ранее сотни сотрудников подписали открытое письмо генеральному директору Сундару Пичаю (Sundar Pichai) с требованием отказаться от секретных контрактов с Пентагоном.

Однако вскоре после этого Google, наряду с OpenAI и Nvidia, заключила соглашения, позволяющие Министерству обороны США использовать их ИИ-модели для «любых законных государственных целей». Национальный представитель CWU по технологическим работникам Джон Чадфилд (John Chadfield) назвал текущий момент важным шагом, позволяющим техническим специалистам объединиться на основе солидарности и потребовать от работодателя прекратить участие в военно-промышленных контрактах. При этом стоит отметить, что в 2024 году компания уже уволила более 50 сотрудников в ответ на протесты против военного сотрудничества Google с правительством Израиля.

ИИ-модели Google Gemini найдут физическое воплощение в роботах Agile Robots

Компания Google заключила партнёрское соглашение с немецкой компанией Agile Robots — поисковый гигант решил сделать ставку на робототехнику как ключевой инструмент развития по направлению искусственного интеллекта.

 Источник изображения: agile-robots.com

Источник изображения: agile-robots.com

Agile Robots специализируется на разработке интеллектуальных роботизированных манипуляторов и оснащённых сенсорами человекоподобных роботов. В рамках сотрудничества в оборудование немецкой компании будут интегрироваться ИИ-модели Google Gemini Robotics. «Партнёрство основывается на убеждении, что применение ИИ в физическом мире должно трансформироваться. Объединив оборудование Agile Robots и другие разрабатываемые в Германии решения в области робототехники с базовыми моделями Google DeepMind Gemini Robotics, обе стороны добьются успеха за счёт развёртывания роботов, сбора данных, обучения моделей и поэтапного совершенствования», — говорится в блоге компании.

Google будет получать данные о работе своих продуктов в реальном мире — для технологического гиганта робототехника выступает одним из важнейших сценариев применения ИИ, где она конкурирует с Amazon и Tesla. У компании множество партнёрских соглашений по этому направлению. Мюнхенская Agile Robots к настоящему моменту развернула более 20 000 роботизированных систем по всему миру; решения Google она намеревается масштабно интегрировать в уже действующие системы. На начальном этапе это будут «высокоценные промышленные» сценарии, в том числе в производстве. Компания поможет Google и далее разрабатывать «более совершенные модели ИИ для роботов нового поколения».

В прошлом году Google выпустила базовую и рассуждающую ИИ-модели Gemini Robotics и объявила о сотрудничестве с техасской Apptronik; в этом году стало известно, что подразделение Google DeepMind будет сотрудничать с Boston Dynamics в работе над роботом Atlas. Под управление Google была переведена входившая в холдинг Alphabet компания Intrinsic, которой прочат судьбу «Android в робототехнике»; в DeepMind также приняли на работу бывшего технического директора Boston Dynamics Аарона Сондерса (Aaron Saunders). Впрочем, некоторые сотрудники Google не вполне довольны сотрудничеством поискового гиганта с Boston Dynamics — у компании есть действующие контракты с Министерством обороны США.

Глава Google DeepMind: автономный ИИ может выйти из-под контроля — нужно глобальное регулирование

Генеральный директор и соучредитель лаборатории Google DeepMind Демис Хассабис (Demis Hassabis) заявил, что широкомасштабное развёртывание систем искусственного интеллекта несёт с собой серьёзные риски, требующие срочного внимания и международного сотрудничества для их устранения. Он полагает, что существующие институты могут не справиться с управлением будущими разработками в области ИИ.

 Источник изображения: Google DeepMind

Источник изображения: Google DeepMind

Хассабис выделил две основные категории рисков, связанных с технологиями ИИ: злоумышленники, использующие полезные технологии во вредных целях, и технические риски, присущие всё более автономным системам. «По мере того, как системы становятся все более автономными, все более независимыми, они будут становиться все более полезными, все более похожими на агентов, но они также будут иметь больший потенциал для рисков и совершения действий, которые, возможно, не были предусмотрены при их проектировании», — заявил он в интервью Bloomberg Television.

Хассабис также выразил обеспокоенность тем, что существующие институты могут оказаться недостаточно подготовленными для управления будущими разработками в области ИИ. Он отметил глобальный охват технологии, добавив, что «она цифровая, а значит, вероятно, затронет каждого в мире и пересечёт границы».

На саммите по искусственному интеллекту в Индии Хассабис подчеркнул важность международных мероприятий, как важнейших площадок для объединения лиц, принимающих решения, с технологами. «Необходимо наличие элементов международного сотрудничества, или, по крайней мере, минимальных стандартов в отношении того, как следует внедрять эти технологии», — уверен он.

В Google DeepMind удивились спешке OpenAI с внедрением рекламы в ChatGPT

Гендиректор Google DeepMind Демис Хассабис (Demis Hassabis) выразил удивление поспешностью OpenAI после появления сообщений о том, что она уже перешла к внедрению рекламы в свой ИИ-чат-бот для получения дополнительного дохода от пользователей ChatGPT, у которых нет платной подписки. По его мнению, это решение может изменить восприятие сервиса пользователями.

 Источник изображения: Growtika/unsplash.com

Источник изображения: Growtika/unsplash.com

«Я немного удивлён, что они так рано перешли к этому», — сказал Хассабис в интервью Axios в Давосе, вместе с тем отметив, что в рекламе нет ничего плохого, и она может быть полезной для финансирования, если «сделана хорошо». В ответ на вопрос репортёра об использовании рекламы для монетизации услуг ИИ, он заявил, что команда Google очень тщательно обдумывала эту идею.

Хассабис также сказал, что его команда не чувствует давления со стороны руководства технологического гиганта, чтобы принять «поспешное» решение относительно рекламы, несмотря на важность рекламы в структуре доходов основного бизнеса Google.

Хотя OpenAI, по всей видимости, вынуждена рассмотреть возможность размещения рекламы с учётом растущих затрат, это решение может изменить восприятие сервиса пользователями. В настоящее время число еженедельно активных пользователей ИИ-чат-бота составляет около 800 млн.

«При использовании голосовых помощников, если вы рассматриваете чат-ботов как помощников, которые должны быть полезными, а также технологий, которые работают на вас как на отдельного человека, возникает вопрос о том, как реклама вписывается в эту модель? Вы хотите доверять своему помощнику. Так как же это работает?» — задался Хассабис вопросом.

Он заметил, что что у Google нет «никаких текущих планов» по ​​размещению рекламы в своем чат-боте с искусственным интеллектом. Вместо этого компания планирует отслеживать ситуацию, чтобы видеть реакцию пользователей.

Сама идея проникновения рекламы в разговоры людей с ИИ-помощниками вызывает у них негативную реакцию. Например, когда OpenAI в прошлом месяце начала изучать функцию, предлагающую приложения для тестирования во время чатов пользователей, они отреагировали негативно, поскольку эти предложения кажутся навязчивой рекламой. После этого OpenAI отключила функцию, заявив, что предложения на самом деле не являются рекламой, поскольку «не имеют финансовой составляющей».

Но речь не о платежах за рекламу. Скорее, дело в том, как предложения приложений ухудшали качество взаимодействия пользователей с чат-ботом.

По словам Хассабиса, использование чат-бота — это совсем другой опыт, чем использование поиска Google. Чат-боты призваны стать полезными цифровыми помощниками, которые знают о вас и могут помочь во многих аспектах жизни, сказал он.

Навязывание рекламы пользователю во время общения с ИИ-помощником может вызывать отторжение. Именно поэтому клиенты негативно отнеслись к попыткам Amazon внедрить рекламу в Alexa — им нужен помощник, а не персональный покупатель, предлагающий товары.

Глава Google DeepMind оценил отставание китайских ИИ-моделей в шесть месяцев

Генеральный директор DeepMind Демис Хассабис (Demis Hassabis) на прошлой неделе уже заявлял, что отставание китайских ИИ-моделей от западных за последние пару лет заметно сократилось, но оно всё же измеряется несколькими месяцами. В интервью Bloomberg на форуме в Давосе он предпочёл определить этот разрыв величиной в шесть месяцев.

 Источник изображения: Isomorphic Labs

Источник изображения: Isomorphic Labs

Как отметил Демис Хассабис, китайские разработчики неплохо себя проявили в преследовании лидеров отрасли, но им лишь представить доказать, что они способны опередить их и преодолеть соответствующий барьер на уровне инноваций. Прошлогоднюю модель китайской DeepSeek глава DeepMind до сих пор называет «впечатляющей». Любопытно, что не все ведущие западные игроки ИИ-сегмента положительно оценивают решение властей США открыть поставки ускорителей Nvidia H200 в Китай. По мнению главы Anthropic Дарио Амодеи (Dario Amodei), поставки таких ускорителей в Китай схожи с продажей ядерного оружия в Северную Корею.

DeepMind в составе Google работает не только над совершенствованием ИИ-ассистента на базе Gemini, но и интересуется направлением робототехники, которая всё чаще ассоциируется у участников рынка со следующим по важности воплощением искусственного интеллекта. По мнению Хассабиса, в сфере «физического ИИ» в скором времени должны произойти прорывные изменения. При этом перед разработчиками стоят сложные проблемы. «Очень сложно добиться надёжности, силы и подвижности человеческой кисти», — признаётся глава DeepMind.

Глава Google DeepMind считает, что китайские разработчики ИИ-моделей отстают от американских лишь на несколько месяцев

В понимании американских властей лидерство в сфере искусственного интеллекта является важным фактором доминирования США на мировой арене, поэтому попытки сдерживать развитие Китая в этой области предпринимаются регулярно. При этом глава стартапа DeepMind, который принадлежит Google, уверен в наличии отставания китайских ИИ-моделей от американских лишь на несколько месяцев.

 Источник изображения: Unsplash, Solen Feyissa

Источник изображения: Unsplash, Solen Feyissa

В своём интервью CNBC генеральный директор DeepMind Демис Хассабис (Demis Hassabis) подчеркнул, что китайские ИИ-модели по своим возможностям сейчас значительно ближе к западным, чем два года назад. «Возможно, в настоящее время они отстают всего лишь на несколько месяцев», — пояснил глава DeepMind, чьи разработки лежат в основе ИИ-ассистента Google Gemini. Главный вопрос, по его мнению, заключается в наличии у китайских разработчиков возможности предложить что-то действительно новое и прорывное на текущем этапе развития, опередив западных конкурентов. Пока китайские разработчики подобного потенциала продемонстрировать не могли, хотя и доказали свою способность быстро догонять западных конкурентов.

Примером такой прорывной разработки глава DeepMind считает создание моделей-трансформеров в 2017 году, которые позже легли в основу не только Google Gemini, но и ChatGPT компании OpenAI. Глава и основатель Nvidia Дженсен Хуанг (Jensen Huang) подчёркивает другие сильные стороны Китая. В этой стране много источников электроэнергии и хорошо развита инфраструктура, но США опережают КНР в сфере разработки ИИ-чипов. С точки зрения разработки ИИ-моделей Китай достиг вполне приличного уровня развития, как считает глава Nvidia.

На прошлой неделе представитель Alibaba заявил, что шансы опережения китайскими разработчиками американских конкурентов в перспективе ближайших трёх или пяти лет не превышают 20 %. Отчасти это обусловлено тем, что американская вычислительная инфраструктура на два порядка превосходит китайскую.

По мнению главы DeepMind, отсутствие прорывных разработок в сфере ИИ в данный момент обусловлено не техническими, а ментальными ограничениями. В Китае есть достаточно талантливых инженеров, но двигать прогресс должны учёные, по его словам. «Изобрести что-либо в 100 раз сложнее, чем просто копировать», — пояснил Хассабис.

«Одно из важнейших направлений в науке»: Google DeepMind откроет ИИ-лабораторию в Великобритании по поиску новых материалов

Google DeepMind откроет свою первую исследовательскую лабораторию для создания новых материалов, таких как те, что используются в аккумуляторных батареях и полупроводниковой отрасли. Этот объект начнёт функционировать в Великобритании в следующем году и станет частью стремления компании по расширению применения искусственного интеллекта в научной среде. Проект реализуется в рамках масштабного партнёрства Alphabet, материнской компании Google, и британского правительства.

 Источник изображения: Alex Dudar / unsplash.com

Источник изображения: Alex Dudar / unsplash.com

Google DeepMind планирует адаптировать несколько своих ИИ-моделей, включая Gemini, для повышения эффективности выполнения задач учёных, преподавателей и госслужащих Великобритании. Лондонское исследовательское подразделение DeepMind описывает новую лабораторию как свой первый «автоматизированный» объект, где для проведения экспериментов будут задействованы роботы, что сводит к минимуму вмешательство со стороны человека. Компания не раскрыла стоимость реализации этого проекта, а также не уточнила, сколько человек будет работать в ИИ-лаборатории.

Расширение сотрудничества с Великобританией является успехом для Google, которая стремится вовлекать правительства разных стран в использование своих облачных сервисов и ИИ-модели Gemini. Это также свидетельствует о планах DeepMind продвинуться дальше в материаловедение, одно из основных исследовательских направлений. Несколько стартапов, часть из которых основана бывшими инженерами DeepMind, пытаются задействовать ИИ-алгоритмы для открытия новых материалов, утверждая, что такой подход может существенно сократить время и затраты на исследования.

В новой лаборатории DeepMind будут исследоваться материалы, потенциально пригодные для использования в разных сферах, включая производство полупроводниковой продукции и солнечных панелей. В дополнение к этому компания предоставит британским ученым «приоритетный доступ» к четырём своим научным ИИ-моделям, включая алгоритмы для анализа ДНК и прогнозирования погоды. «Открытие новых материалов — одно из важнейших направлений в науке», — написал недавно в блоге глава DeepMind Демис Хассабис (Demis Hassabis).

В отдельном заявлении правительства Великобритании сказано, что американская компания внесёт вклад в исследования в таких областях, как термоядерная энергетика, а также разработает инструменты на базе Gemini для британских учёных. В заявлении DeepMind упоминается, что компания откроет доступ к своим ИИ-моделям и данным для сотрудников Института безопасности искусственного интеллекта Великобритании, который представляет собой государственное агентство, созданное в 2023 году для тестирования и оценки ИИ-систем.

Google представила геймерского ИИ-агента SIMA 2 — он умеет проходить незнакомые игры

Разработчики исследовательского подразделения Google DeepMind создали новую версию ИИ-агента SIMA 2 для игр. Этот инструмент способен не просто следовать командам, а понимать цели игрока и самостоятельно выполнять сложные действия в видеоиграх. В отличие от первой версии, запущенной в марте 2024 года, SIMA 2 использует языковую модель Gemini, что позволяет ему рассуждать и принимать решения даже в тех играх, которые он никогда раньше не видел, например, No Man’s Sky, Valheim и Goat Simulator 3.

 Источник изображения: Google DeepMind

Источник изображения: Google DeepMind

Пока система доступна лишь ограниченному числу исследователей и разработчиков в рамках закрытого тестирования. При этом в DeepMind подчёркивают, что главная цель проекта состоит не в создании игрового помощника для массового пользователя, а в отработке технологий, которые в будущем могут применяться вне виртуального мира. Джейн Ванг (Jane Wang), старший научный сотрудник DeepMind, назвала видеоигры «идеальной площадкой для обучения ИИ навыкам, полезным в реальной жизни».

Команда DeepMind рассматривает проект SIMA 2 как важный шаг на пути к созданию искусственного общего интеллекта (AGI). В компании считают, что способность ИИ действовать в незнакомой среде и выполнять сложные цели лежит в основе будущих систем, включая роботов общего назначения, и именно эта способность адаптироваться к новым условиям может привести к развитию действительно универсального ИИ.

Google представила ИИ-агента CodeMender — он самостоятельно устраняет уязвимости ПО

Лаборатория Google DeepMind опубликовала результаты работы агента на базе искусственного интеллекта CodeMender. Агент может в автономном режиме выявлять, исправлять и переписывать уязвимый код для предотвращения будущих эксплойтов в программном обеспечении.

 Источник изображения: Google

Источник изображения: Google

Как пишет издание SiliconANGLE, CodeMender развивает предыдущие проекты DeepMind по поиску уязвимостей, в частности проект OSS-Fuzz для анализа безопасности открытого ПО и систему Big Sleep, сочетая интеллектуальные возможности моделей Gemini с передовыми методами программного анализа. Основной целью проекта является автономная отладка и исправление сложных ошибок в крупномасштабных кодовых базах.

Несмотря на то что проект находится на стадии исследований, CodeMender уже отправил 72 исправления безопасности в проекты с открытым исходным кодом, включая те, объём которых превышает 4,5 миллиона строк кода. По данным компании, ИИ-агент позволяет разработчикам сосредоточиться на создании качественного программного обеспечения, автоматически генерируя и применяя надёжные патчи безопасности.

Система спроектирована как для реактивной, так и для проактивной работы: она не только мгновенно исправляет обнаруженные уязвимости, но и переписывает существующий код, устраняя целые классы ошибок. В качестве примера исследователи DeepMind приводят работу агента с библиотекой сжатия изображений libwebp, которая была использована в атаке на iOS в 2023 году. Агент применил к ней аннотации -fbounds-safety, после чего, по заявлению исследователей, подобные уязвимости переполнения буфера стали «невозможными для эксплуатации навсегда».

Внутренняя архитектура CodeMender включает набор инструментов: статический и динамический анализ, фаззинг, символьное исполнение и так называемого «судью LLM», который проверяет, сохраняют ли предлагаемые изменения исходную функциональность. Система способна к самокоррекции, если в процессе проверки обнаруживается проблема. Все изменения перед отправкой проходят проверку на корректность, соответствие стилевым стандартам и отсутствие регрессий. При этом в DeepMind подчёркивают, что CodeMender пока остаётся исследовательским проектом, и все патчи, сгенерированные им, проходят проверку исследователями-людьми перед отправкой в проекты.

После запуска инструмент будет предлагать иной подход по сравнению с традиционными методами, такими как статический анализ и фаззинг, которые находят уязвимости, но всё ещё сильно зависят от опыта проверяющего человека. Новый подход изменит систему, в которой искусственный интеллект сможет самостоятельно выявлять и устранять ошибки, что является критически важным шагом по мере экспоненциального роста размера и сложности современных кодовых баз.

Разработчики сосредоточились на ИИ-моделях мира для создания сверхразума

Ведущие разработчики ИИ, такие как Google DeepMind, Meta✴ и Nvidia, уделяют всё больше внимания так называемым моделям мира, которые могут лучше понимать окружающую среду, в стремлении создать машинный «сверхразум», пишет The Financial Times.

 Источник изображения: julien Tromeur/unsplash.com

Источник изображения: julien Tromeur/unsplash.com

Модель мира имитирует причинно-следственные связи и законы физики посредством симуляций, основанных на обучении, для которого требуется огромный объём данных из реальных или моделируемых сред и большие вычислительные мощности. Они рассматриваются как важный шаг в развитии беспилотных автомобилей, робототехники и так называемых ИИ-агентов.

«ИИ по-прежнему ограничен цифровой сферой, — говорит Шломи Фрухтер (Shlomi Fruchter), соруководитель Genie 3 в Google DeepMind. — Создавая среды, которые выглядят или ведут себя как реальный мир, мы получаем гораздо более масштабируемые способы обучения ИИ без реальных последствий совершения ошибок в реальном мире».

Янн Лекун (Yann LeCun), возглавляющий исследовательскую лабораторию Meta✴ AI (прежнее название — Facebook✴ Artificial Intelligence Research, FAIR), заявил, что большие языковые модели (LLM) никогда не достигнут способности рассуждать и планировать как люди.

Одной из ближайших областей применения моделей мира станет индустрия развлечений, где они позволяют создавать интерактивные и реалистичные сцены. Например, стартап World Labs разрабатывает модель, которая генерирует трёхмерные среды, похожие на видеоигры, из одного изображения.

Runway, стартап по созданию видео, в числе партнёров которого голливудские студии, включая Lionsgate, в прошлом месяце выпустил продукт, использующий модели мира для создания игровых сред с персонализированными историями и персонажами, генерируемыми в реальном времени.

Генеральный директор Nvidia Дженсен Хуанг (Jensen Huang) заявил, что следующим крупным этапом роста компании станет «физический ИИ», так как новые модели позволят добиться прорыва в области робототехники. По мнению Лекуна, реализация концепции по созданию ИИ-систем, обеспечивающих машины интеллектом человеческого уровня, может занять 10 лет.

Вместе с тем эксперты указывают на большой потенциал новых ИИ-технологий. «Модели мира открывают возможность обслуживания всех отраслей и усиливают тот же эффект, который компьютеры сделали для интеллектуального труда», заявил Рев Лебаредян (Rev Lebaredian), вице-президент Nvidia по технологиям моделирования.

Google создала и показала в деле ИИ, который заставляет роботов сначала думать, а потом делать

Компания Google DeepMind представила две новые модели искусственного интеллекта (ИИ) для робототехники Gemini Robotics 1.5 и Gemini Robotics-ER 1.5, которые совместно реализуют подход, при котором робот сначала «обдумывает» задачу и только потом выполняет действие. Технология основана на генеративных ИИ-системах и призвана преодолеть ограничения современных роботов, требующих длительной настройки под каждую конкретную задачу.

 Источник изображения: Google

Источник изображения: Google

Генеративные ИИ-системы, способные создавать текст, изображения, аудио и даже видео, становятся всё более распространёнными. Подобно тому, как такие модели генерируют указанные типы данных, они могут также выдавать последовательности действий для роботов. Именно на этом принципе построен проект Gemini Robotics от Google DeepMind, в рамках которого анонсированы две взаимодополняющие модели, позволяющие роботам «думать» перед тем, как действовать. Хотя традиционные большие языковые модели (LLM) имеют ряд ограничений, внедрение симулированного рассуждения значительно расширило их возможности, и теперь аналогичный прорыв может произойти в робототехнике.

Команда Google DeepMind считает, что генеративный ИИ способен кардинально изменить робототехнику, обеспечив роботам универсальную функциональность. В отличие от современных систем, которые требуют месяцев настройки под одну узкоспециализированную задачу и плохо адаптируются к новым условиям, новые ИИ-подходы позволяют роботам работать в незнакомых средах без перепрограммирования. Как отметила Каролина Парада (Carolina Parada), руководитель направления робототехники в DeepMind, роботы на сегодняшний день «чрезвычайно специализированы и сложны в развёртывании».

Для реализации концепции DeepMind разработала Gemini Robotics-ER 1.5 и Gemini Robotics 1.5. Первая — это модель «зрение–язык» (VLM) с функцией воплощённого рассуждения (embodied reasoning), которая анализирует визуальные и текстовые данные, формирует пошаговый план выполнения задачи и может подключать внешние инструменты, например, поиск Google для уточнения контекста. Вторая — модель «зрение–язык–действие» (VLA), которая преобразует полученные инструкции в физические действия робота, одновременно корректируя их на основе визуальной обратной связи и собственного процесса «обдумывания» каждого шага. По словам Канишки Рао (Kanishka Rao) из DeepMind, ключевым прорывом стало наделение робота способностью имитировать интуитивные рассуждения человека, то есть думать перед тем, как действовать.

Разработчики наглядно продемонстрировали, как работают новые модели — наделённый Gemini Robotics 1.5 человекоподобный робот Apollo на видео упаковывает вещи для поездки, а другой робот Aloha 2, точнее пара роборук — сортирует мусор.

Обе модели основаны на фундаментальной архитектуре Gemini, но дополнительно дообучены на данных, отражающих взаимодействие с физическим миром. Это позволяет роботам выполнять сложные многоэтапные задачи, приближая их к уровню автономных агентов. При этом система демонстрирует кроссплатформенную совместимость. В частности, навыки, внедрённые в одного робота, например, на двурукого Aloha 2, могут быть перенесены на другого, включая гуманоида Apollo, без дополнительной настройки под конкретную механику.

Несмотря на вероятный технологический прорыв, практическое применение технологии пока ограничено. Модель Gemini Robotics 1.5, отвечающая за управление роботами, доступна только доверенным тестировщикам. В то же время Gemini Robotics-ER 1.5 уже интегрирована в Google AI Studio, что даёт разработчикам возможность генерировать инструкции для собственных экспериментов с физически воплощёнными роботами. Однако, как считает Райан Уитвам (Ryan Whitwam) из Ars Technica, до появления бытовых роботов, способных выполнять повседневные задачи, ещё предстоит пройти значительный путь.

ИИ от OpenAI обошёл все команды из людей, а заодно и Google Deepmind, на чемпионате по программированию

Искусственный интеллект от OpenAI показал выдающийся результат в финале Международного студенческого чемпионата по программированию ICPC 2025, решив все 12 задач и превзойдя как команды студентов, так и модель Gemini 2.5 от Google Deepmind, передаёт сайт Decoder.

 Турнир ICPC 2025. Источник изображения: worldfinals.icpc.global

Турнир ICPC 2025. Источник изображения: worldfinals.icpc.global

В OpenAI рассказали, что её система решала задачи в таких же условиях, что и участники-люди, не имея никаких преимуществ. Задания выдавались в стандартном PDF-формате, на решение выдавалось пять часов. Ответы направлялись официальному судье ICPC, который оценивал все работы по одинаковым критериям.

«Участник» от OpenAI состоял из двух моделей — GPT-5 и ещё одной, экспериментальной системы. GPT-5 успешно справилась с 11 задачами, а последнюю, самую сложную, решила экспериментальная модель после девяти попыток. Комбинированная система OpenAI превзошла результат Deepmind, который также участвовал в соревновании. Модель от Google решила только 10 задач.

При этом ни OpenAI, ни Deepmind не участвовали в турнире официально, поэтому все призовые места были присуждены участникам-людям. Первое место в общем зачёте заняла команда Санкт-Петербургского госуниверситета.

Интересно, что только ИИ-модели — от OpenAI и Google — решили одну из задач (Problem C), которую не смогла решить ни одна человеческая команда.

В OpenAI подчёркивают, что её модель специально не обучалась для участия в конкурсах, решения генерировались в рамках общего подхода к логическому выводу и анализу.

Турнир ICPC 2025 проходил в Баку, столице Азербайджана.

Ранее те же модели показали высокие результаты на Международной математической олимпиаде и Международной олимпиаде по информатике.

Google научила ИИ создавать живые 3D-миры, которые не рассыпаются за минуту — Genie 3 проложит путь к AGI

Google DeepMind выпустила новую версию своей ИИ-модели мира — Genie 3, способную генерировать трёхмерные среды, с которыми можно взаимодействовать в реальном времени. Компания утверждает, что пользователи смогут исследовать сгенерированные миры гораздо дольше, чем раньше, а модель будет запоминать расположение предметов, остающихся за пределами кадра. Мировые модели также являются важным шагом на пути к «сильному ИИ», поскольку позволяют обучать ИИ без ограничений в богатой среде.

 Источник изображений: Google

Источник изображений: Google

Модели мира или мировые модели — это тип систем искусственного интеллекта, которые могут моделировать трёхмерные среды для образовательных, развлекательных и научных целей, а также для обучения роботов или агентов ИИ. В сгенерированном пространстве на основе текстовой подсказки пользователь может перемещаться, как в видеоигре. В это направление ИИ Google вкладывает значительные ресурсы. В декабре компания представила Genie 2, способную создавать интерактивные миры на основе изображений, а сейчас формирует новую команду по созданию моделей миров под руководством бывшего ведущего разработчика генератора видео Sora от OpenAI.

У существующих моделей миров пока сохраняется множество недостатков. Например, в сгенерированном Genie 2 мире можно находиться не более одной минуты. По отзывам экспертов, подобные миры больше напоминали «прогулку по размытой версии Google Street View, где всё менялось и трансформировалось неожиданным образом, когда пользователь отводил взгляд».

Genie 3, по всей видимости, может стать заметным шагом вперёд. Разработчики утверждают, что пользователи смогут создавать миры, в которых поддерживается «несколько» минут непрерывного взаимодействия. Genie 3 может удерживать в памяти сгенерированные объекты около минуты, что позволит пользователю возвращаться к ним и обнаруживать их на прежнем месте.

В Genie 3 появились так называемые «подсказываемые мировые события», позволяющие в реальном времени менять погодные условия или добавлять новых персонажей. Google сообщает, что пока количество способов взаимодействия с генерируемыми мирами ограничено, а читаемый текст «часто появляется только при наличии его в исходном описании мира».

На текущем этапе создаваемые модели миров обеспечивают разрешение 720p при частоте 24 кадра в секунду. Genie 3 пока недоступна для широкой аудитории. По словам Google, она существует в виде «ограниченной исследовательской предварительной версии», доступной «небольшой группе учёных и разработчиков» для тщательной оценки возможных рисков и путей их минимизации. Компания заявила, что пока лишь «изучает», как в дальнейшем предоставить доступ к Genie 3 «дополнительным тестировщикам».

ИИ от Google самостоятельно обнаружил 20 уязвимостей в открытом ПО

Искусственный интеллект Google впервые самостоятельно выявил 20 уязвимостей в открытом программном обеспечении (Open Source). Баги были обнаружены с помощью системы Big Sleep в таких проектах, как мультимедийная библиотека FFmpeg и графический редактор ImageMagick. Об этом сообщил TechCrunch со ссылкой на заявление в X вице-президента компании по безопасности Хизер Адкинс (Heather Adkins).

 Источник изображения: AI

Источник изображения: AI

Система Big Sleep была разработана совместно подразделением DeepMind и командой экспертов по кибербезопасности Project Zero. Google пока не раскрывает деталей найденных уязвимостей, так как они ещё не устранены. Однако сам факт успешной работы Big Sleep подтверждает, что ИИ-инструменты начинают приносить реальные результаты. По словам представителя компании Кимберли Самры (Kimberly Samra), каждый баг был найден и воспроизведён ИИ без участия человека, хотя перед отправкой отчётов эксперты, конечно же, перепроверили все данные.

Вице-президент Google по инженерии Роял Хансен (Royal Hansen) назвал это прорывом в автоматизированном поиске уязвимостей. При этом Big Sleep — не единственный подобный инструмент: на рынке уже действуют и другие ИИ-системы, такие как RunSybil и XBOW. Последний, в частности, занимает верхние позиции в рейтинге платформы HackerOne, специализирующейся на поиске уязвимостей.

Сооснователь и технический директор RunSybil Влад Ионеску (Vlad Ionescu) оценил Big Sleep как серьёзный и продуманный проект, подчеркнув, что за ним стоят опытнейшие специалисты. При этом он отметил растущую проблему: некоторые ИИ-системы генерируют ложные отчёты, имитируя реальные уязвимости. По его словам, разработчики всё чаще получают сообщения, которые выглядят убедительно, но на деле не содержат настоящих ошибок. Это явление он назвал цифровым «мусором» в сфере Bug Bounty — программы вознаграждений разработчикам за найденные ошибки.


window-new
Soft
Hard
Тренды 🔥
ИИ теперь пишет 60 % нового кода Airbnb — и сам решает 40 % запросов в техподдержку 12 мин.
Google начала тестировать ИИ-агента Remy — конкурента OpenClaw 13 мин.
Россияне массово жалуются на блокировки аккаунтов в Anthropic Claude — потеряны проекты и переписки с ИИ 15 мин.
Амбициозный хоррор Paranormal Activity: Threshold от создателя The Mortuary Assistant отменён из-за конфликта с Paramount Pictures 28 мин.
Windows 11 до сих пор держится на коде эпохи Windows 95 — попытки заменить его провалились 36 мин.
Архивировать интернет становится всё сложнее: Wayback Machine и Wikimedia страдают от дефицита HDD 40 мин.
«Золотой глобус» не будет дисквалифицировать номинантов из-за ИИ, но излишеств не допустит 3 ч.
ИИ Gmail научился подстраиваться под стиль письма пользователя — «Помоги мне написать» получила обновление 4 ч.
Мосгорсуд отменил решение о запрете портала «ЯПлакалъ» 4 ч.
Selectel запускает программу поддержки AI-проектов с грантом до 2 млн рублей на IT-инфраструктуру 4 ч.