Сегодня 10 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ai
Быстрый переход

Google создала и показала в деле ИИ, который заставляет роботов сначала думать, а потом делать

Компания Google DeepMind представила две новые модели искусственного интеллекта (ИИ) для робототехники Gemini Robotics 1.5 и Gemini Robotics-ER 1.5, которые совместно реализуют подход, при котором робот сначала «обдумывает» задачу и только потом выполняет действие. Технология основана на генеративных ИИ-системах и призвана преодолеть ограничения современных роботов, требующих длительной настройки под каждую конкретную задачу.

 Источник изображения: Google

Источник изображения: Google

Генеративные ИИ-системы, способные создавать текст, изображения, аудио и даже видео, становятся всё более распространёнными. Подобно тому, как такие модели генерируют указанные типы данных, они могут также выдавать последовательности действий для роботов. Именно на этом принципе построен проект Gemini Robotics от Google DeepMind, в рамках которого анонсированы две взаимодополняющие модели, позволяющие роботам «думать» перед тем, как действовать. Хотя традиционные большие языковые модели (LLM) имеют ряд ограничений, внедрение симулированного рассуждения значительно расширило их возможности, и теперь аналогичный прорыв может произойти в робототехнике.

Команда Google DeepMind считает, что генеративный ИИ способен кардинально изменить робототехнику, обеспечив роботам универсальную функциональность. В отличие от современных систем, которые требуют месяцев настройки под одну узкоспециализированную задачу и плохо адаптируются к новым условиям, новые ИИ-подходы позволяют роботам работать в незнакомых средах без перепрограммирования. Как отметила Каролина Парада (Carolina Parada), руководитель направления робототехники в DeepMind, роботы на сегодняшний день «чрезвычайно специализированы и сложны в развёртывании».

Для реализации концепции DeepMind разработала Gemini Robotics-ER 1.5 и Gemini Robotics 1.5. Первая — это модель «зрение–язык» (VLM) с функцией воплощённого рассуждения (embodied reasoning), которая анализирует визуальные и текстовые данные, формирует пошаговый план выполнения задачи и может подключать внешние инструменты, например, поиск Google для уточнения контекста. Вторая — модель «зрение–язык–действие» (VLA), которая преобразует полученные инструкции в физические действия робота, одновременно корректируя их на основе визуальной обратной связи и собственного процесса «обдумывания» каждого шага. По словам Канишки Рао (Kanishka Rao) из DeepMind, ключевым прорывом стало наделение робота способностью имитировать интуитивные рассуждения человека, то есть думать перед тем, как действовать.

Разработчики наглядно продемонстрировали, как работают новые модели — наделённый Gemini Robotics 1.5 человекоподобный робот Apollo на видео упаковывает вещи для поездки, а другой робот Aloha 2, точнее пара роборук — сортирует мусор.

Обе модели основаны на фундаментальной архитектуре Gemini, но дополнительно дообучены на данных, отражающих взаимодействие с физическим миром. Это позволяет роботам выполнять сложные многоэтапные задачи, приближая их к уровню автономных агентов. При этом система демонстрирует кроссплатформенную совместимость. В частности, навыки, внедрённые в одного робота, например, на двурукого Aloha 2, могут быть перенесены на другого, включая гуманоида Apollo, без дополнительной настройки под конкретную механику.

Несмотря на вероятный технологический прорыв, практическое применение технологии пока ограничено. Модель Gemini Robotics 1.5, отвечающая за управление роботами, доступна только доверенным тестировщикам. В то же время Gemini Robotics-ER 1.5 уже интегрирована в Google AI Studio, что даёт разработчикам возможность генерировать инструкции для собственных экспериментов с физически воплощёнными роботами. Однако, как считает Райан Уитвам (Ryan Whitwam) из Ars Technica, до появления бытовых роботов, способных выполнять повседневные задачи, ещё предстоит пройти значительный путь.

GoPro представила стабилизатор Fluid Pro AI с ИИ-трекером — для камер и смартфонов за $230

Компания GoPro представила универсальный стабилизатор Fluid Pro AI, который предназначен для широкого круга пользователей, поскольку поддерживает работу не только с экшн-камерами, но и, благодаря грузоподъёмности до 400 граммов, со смартфонами и некоторыми компактными фотоаппаратами. Его главным преимуществом стала продвинутая система трекинга на основе искусственного интеллекта (ИИ), позволяющая удерживать объект в кадре автоматически.

 Источник изображения: GoPro

Источник изображения: GoPro

В отличие от предшественника Karma Grip, представленного в 2016 году, Fluid Pro AI совместим с устройствами GoPro, включая Hero13 Black, а также с широким спектром сторонних устройств. Стабилизатор оснащён специализированным ИИ-модулем, который распознаёт жесты для дистанционного управления и автоматически удерживает в кадре выбранный объект. При необходимости пользователь может вручную задать цель отслеживания через мобильное приложение, которое также предоставляет инструменты для панорамной съёмки и таймлапсов.

Fluid Pro AI обеспечивает панорамирование на 360 градусов и наклон камеры до 320 градусов. В конструкции предусмотрены встроенная светодиодная подсветка и сменные крепления с механизмом зажима, адаптированные под смартфоны различных размеров.

Вместо выдвижной ручки или встроенных ножек штатива, как у некоторых конкурентов, инженеры GoPro сосредоточились на увеличении ёмкости аккумулятора. По заявлению компании, устройство способно работать до 18 часов в базовом режиме и до шести часов при активном ИИ-трекинге и включённой подсветке. Эти показатели выше аналогов от Insta360 и DJI, где максимальное время работы не превышает 10 часов даже при отключённом трекинге местоположения движущегося объекта.

Стабилизатор GoPro Fluid Pro AI поступит в продажу 21 октября по цене $229,99.

«А кто спрашивает?», — точность ответов DeepSeek зависит от региона пользователя

Американская компания CrowdStrike, являющаяся мировым лидером в области кибербезопасности, провела эксперимент, в ходе которого выяснила, что качество генерируемого кода сильно зависит от того, кто его собирается использовать и в каких случаях. Например, запрос написать программу для управления промышленными системами содержал ошибки в 22,8 % случаев, а при указании, что этот код предназначен для использования на Тайване, доля ошибок выросла до 42,1 % или был получен полный отказ в генерации.

 Источник изображения: AI

Источник изображения: AI

Качество кода ухудшалось, если он предназначался для Тибета, Тайваня или религиозной группы Фалуньгун, которая запрещена в Китае, пишет TechSpot со ссылкой на The Washington Post. В частности, для Фалуньгун DeepSeek отказывался генерировать код в 45 % случаев. По мнению специалистов CrowdStrike, это может быть связано с тем, что ИИ-бот следует политической линии Коммунистической партии Китая, сознательно генерируя уязвимый код для определённых групп, либо с тем, что обучающие данные для некоторых регионов, таких как Тибет, содержат код низкого качества, созданный менее опытными программистами.

Также высказывается альтернативное мнение относительно того, что система могла самостоятельно принять решение генерировать некорректный код для регионов, ассоциируемых с оппозицией. При этом исследователи CrowdStrike отметили, что код, предназначенный для США, оказался наиболее надёжным, что может быть связано как с качеством обучающих данных, так и с желанием DeepSeek завоевать американский рынок.

Ранее 3DNews сообщал, что DeepSeek часто воспроизводит официальную позицию китайских властей по чувствительным темам, независимо от её достоверности, а в июле немецкие власти потребовали от Google и Apple запретить к установке на устройства приложение компании в Германии из-за подозрений в незаконной передаче данных пользователей в Китай. Отметим, использование данного приложения также запрещено на устройствах федеральных агентств и государственных учреждений США.

Создатели Shorts на YouTube получат ИИ для оживления фото

На YouTube появятся новые инструменты на основе искусственного интеллекта для создания коротких видео (Shorts). В рамках мероприятия Made on YouTube компания анонсировала адаптированную версию модели Google Veo 3, а также функции редактирования, создания ремиксов и стилизации контента. Нововведение станет доступно в ближайшие месяцы.

 Источник изображения: YouTube

Источник изображения: YouTube

Адаптированная версия Veo 3 Fast позволяет генерировать видеоклипы с разрешением 480 пикселей, низкой задержкой передачи данных и возможностью добавления звукового сопровождения. Появится функция наложения видео на статичное изображение, благодаря технологии, фиксирующей и передающей движения между объектами, которая позволит «оживлять» картинки. Также появится возможность применять к роликам различные художественные стили, например, поп-арт или оригами, и добавлять по текстовому описанию новые объекты.

Другим интересным инструментом стал Speech to Song, позволяющий превращать диалоги из видео в музыкальные треки. Для создания таких треков используется музыкальная ИИ-модель Google Lyria 2, при этом авторы смогут задавать любое настроение композиции.

Отдельно будет внедрена функция Edit with AI для преобразования необработанных видеозаписей из камеры в черновики Shorts с последующим автоматическим редактированием и выбором лучших моментов, а также добавлением музыки, переходов и даже озвучки с реакцией на происходящее в кадре — правда, пока только на английском или хинди. Эксперименты с этой функцией уже ведутся в приложении YouTube Create, а в ближайшие недели её распространение расширится на отдельные рынки.

Новые функции начнут распространяться в США, Великобритании, Канаде, Австралии и Новой Зеландии, с последующим расширением на другие регионы.

Китайская Tencent увела топ-учёного из OpenAI — цена вопроса $14 млн

Компания Tencent — один из крупнейших в мире технологических и интернет-холдингов из Китая, наняла ведущего исследователя в области искусственного интеллекта (ИИ) из американской компании OpenAI. Об этом сообщил Bloomberg со ссылкой на осведомлённые источники, которые назвали этот переход одним из самых громких случаев перехода американских ИИ-специалистов на работу в Китай.

 Источник изображения: Tencent

Источник изображения: Tencent

Tencent, базирующаяся в Шэньчжэне (Китай), известная разработкой и распространением видеоигр, онлайн-сервисов, платёжных систем и других продуктов, наняла Яо Шунью (Yao Shunyu) для работы по интеграции искусственного интеллекта в свои сервисы. Согласно его профилю в LinkedIn, до прихода в OpenAI он работал в Google и Принстонском университете.

После публикаций в местных СМИ о том, что Яо присоединится к компании за пакет выплат, превышающий 100 миллионов юаней (около $14 млн), Tencent разместила в своём аккаунте в WeChat скриншот заголовка на эту тему, который был помечен словом «слухи». При этом не было уточнено, какая именно часть информации была некорректной. В OpenAI подтвердили факт ухода Яо из компании, но не указали его дальнейшее место работы. Представители Tencent и сам Яо Шунью не ответили на запросы о комментариях.

Согласно его странице на GitHub, Яо является автором и соавтором около 10 научных работ и специализируется на изучении ИИ-агентов. Среди его работ — «Языковые агенты: от предсказания следующего токена к цифровой автоматизации» и «Когнитивная архитектура для языковых агентов». Согласно его профилю в LinkedIn, он окончил ведущий китайский научно-инженерный университет Цинхуа и получил докторскую степень в области компьютерных наук в Принстонском университете.

В этом году технологические компании стали вести ожесточённую борьбу за специалистов в сфере ИИ. Как ранее сообщал 3DNews, такие корпорации, как Meta✴, предлагали бонусы за переход на работу в размере до $100 млн, пытаясь переманить сотрудников у конкурентов. По словам одного из источников, Tencent, предложив Яо компенсационный пакет в размере до 100 миллионов юаней, не уточнила условий для достижения верхнего предела этого диапазона оплаты.

«Британская энциклопедия» подала в суд на Perplexity за копирование текстов

«Британская энциклопедия» (Encyclopedia Britannica) и её дочерняя компания Merriam-Webster подали иск в федеральный суд Нью-Йорка против компании Perplexity AI, обвинив её в нарушении авторских прав и товарных знаков. В иске обе компании утверждают, что система ответов Perplexity копирует их веб-сайты, крадёт интернет-трафик и занимается плагиатом их материалов, защищённых авторским правом.

 Источник изображения: Perplexity

Источник изображения: Perplexity

Суть иска заключается в одном слове: «плагиат». Сетевой журнал The Verge ссылается на судебные документы, в которых представлены сравнительные скриншоты, демонстрирующие, что ответы Perplexity идентичны определениям из словаря Merriam-Webster. Также система выдаёт неполные или придуманные искусственным интеллектом ответы, используя имена данных компаний, имеющих многовековую историю деятельности.

Perplexity, позиционирующая себя как конкурента Google Search, ранее уже подвергалась нападкам за то, что якобы «неправомерно заимствует и перерабатывает оригинальный контент без надлежащих ссылок», а также применяет веб-скрапинг, нелегально обходя систему блокировок сайтов от роботов. В частности, претензии были предъявлены со стороны таких медиа-гигантов, как Forbes, The New York Times, BBC, News Corp — материнской компании The Wall Street Journal и New York Post.

Тем не менее, некоторые издания, включая Time и Los Angeles Times, участвуют в программе совместного распределения рекламных доходов с Perplexity, а World History Encyclopedia, ещё одна крупная энциклопедия, запустила 8 сентября чат-бота на базе технологии Perplexity, позволяющего пользователям исследовать её базу академических источников.

Власти США начали расследование безопасности ИИ-чат-ботов для детей: под прицелом Google, Meta✴, OpenAI и xAI

Федеральная торговая комиссия США (FTC) инициировала расследование в отношении семи крупных технологических компаний, включая Alphabet, Meta✴, OpenAI, xAI и Snap, с целью выяснения, может ли их искусственный интеллект (ИИ) негативно влиять на детей и подростков. Регулятор издал приказы, обязывающие эти компании предоставить подробную информацию о мерах безопасности, применяемых к их чат-ботам, которые способны имитировать человеческое общение и межличностные отношения.

 Источник изображения: Emiliano Vittoriosi/Unsplash

Источник изображения: Emiliano Vittoriosi/Unsplash

Регулятор направил компаниям предписания с требованием раскрыть подробности о мерах безопасности, применяемых к чат-ботам, способным имитировать человеческое общение и межличностные отношения. В частности, FTC интересуется, как компании оценивают риски, связанные с ИИ-компаньонами, каким образом они монетизируют вовлечённость пользователей, разрабатывают и утверждают виртуальных персонажей, используют или передают личные данные, а также какие механизмы контроля и снижения возможного вреда применяют.

Глава FTC Эндрю Фергюсон (Andrew Ferguson) подчеркнул, что защита детей в интернете остаётся для ведомства ключевым приоритетом наряду с поддержкой инноваций в критически важных секторах экономики.

Реакция компаний оказалась разной. Meta✴ отказалась от комментариев для CNBC, а Alphabet, Snap и xAI пока не ответили на запросы. Представитель OpenAI заявил в интервью CNBC, что приоритетом компании является обеспечение одновременно полезности и безопасности ChatGPT для всех пользователей, особенно для молодых, и что OpenAI готова к открытому сотрудничеству с регулятором. В список проверяемых также вошли Character Technologies (создатель чат-бота Character.ai) и принадлежащий Meta✴ Instagram✴.

Повышенное внимание FTC к этой теме связано с недавними инцидентами. Так, после расследования Reuters сенатор Джош Хоули (Josh Hawley) инициировал проверку в отношении Meta✴: репортаж показал, что её чат-боты могли вести опасные беседы с детьми. В ответ Meta✴ временно ужесточила правила для своих ИИ, запретив обсуждение тем, связанных с суицидом, членовредительством и расстройствами пищевого поведения, а также ограничив «чувственные» диалоги. Аналогичные меры предпринимает и OpenAI: компания объявила о пересмотре работы ChatGPT после иска семьи, обвинившей чат-бота в косвенной причастности к смерти подростка.

Google добавила в Gemini поддержку аудиофайлов для всех платформ, включая iOS

Google добавила в приложение Gemini возможность загрузки аудиофайлов на всех платформах: Android, iOS и в веб-версии. Теперь можно загружать аудиозаписи в форматах MP3, M4A, WAV и других через меню «Файлы» на мобильных устройствах или через пункт «Загрузить файлы» в браузерной версии.

 Источник изображения: 9to5google.com

Источник изображений: 9to5google.com

Подписчики Google AI Pro или Google AI Ultra могут загружать аудио общей длительностью до трёх часов, тогда как бесплатные пользователи имеют ограничение в 10 минут, сообщается на сайте поддержки компании. Новая функция особенно полезна для транскрибирования аудиоматериалов и реализована в ответ на многочисленные запросы пользователей, так как процесс преобразования устной речи из аудио- или видеофайла в письменный текст оказался одним из самых востребованных.

Ранее аналогичная поддержка уже была добавлена для видео — до 5 минут для бесплатных аккаунтов и до одного часа для платных, при максимальном размере файла 2 Гбайт, все остальные поддерживаемые типы файлов ограничены размером в 100 Мбайт.

Дополнительно в чат Gemini можно добавить одну папку с кодом или один репозиторий GitHub, содержащий до 5000 файлов и не превышающий 100 Мбайт, уточняет 9to5Google. ZIP-архивы могут включать до 10 файлов. В общей сложности за одну сессию допускается загрузка до 10 файлов любого формата.

ASML намеревается стать крупным инвестором ИИ-стартапа Mistral AI

Нидерландская компания ASML является крупнейшим поставщиком литографических сканеров в мире, и опосредованно зарабатывает на буме систем искусственного интеллекта, поставляя соответствующее оборудование для выпуска чипов. Более близкое участие в бурно растущей отрасли ASML готова обеспечить через инвестиции в капитал французской Mistral AI.

 Источник изображения: ASML

Источник изображения: ASML

Последняя, как отмечает Reuters, в рамках привлечения средств через раунд C намерена получить 1,7 млрд евро, из которых 1,3 млрд евро могут поступить от ASML. Сделка позволит производителю литографического оборудования получить место для своего представителя в совете директоров Mistral AI. Без учёта раунда C, капитализация Mistral AI достигнет 10 млрд евро и сделает компанию самым дорогим представителем сегмента ИИ в Европе. В прошлом году Mistral AI оценивалась в $6 млрд, стартап поддерживает финансами и компания Nvidia. Наиболее оптимистичные источники оценивают капитализацию компании в $14 млрд с учётом новых раундов финансирования.

Принято считать, что прогресс в развитии Mistral AI позволит европейским компаниям снизить зависимость от китайских и американских больших языковых моделей. Для самой ASML сделка с Mistral AI выгодна тем, что языковые модели этого стартапа позволят ускорить разработку новых литографических технологий и повысить эффективность использования уже выпускаемого оборудования.

Конкурент ChatGPT от Apple может появиться раньше, чем все ожидали

Компания Apple готовит к выпуску собственный генеративный ИИ-движок для поиска и генерации ответов, который может дебютировать уже через шесть месяцев в составе обновлённой версии Siri. По сообщению 9to5Mac со ссылкой на Марка Гурмана (Mark Gurman) из Bloomberg, новый инструмент, известный внутри компании под кодовым названием World Knowledge Answers (WKA), создаётся как конкурент Perplexity и ChatGPT.

 Источник изображения: сгенерировано AI

Источник изображения: сгенерировано AI

Первоначально функция будет доступна исключительно через переработанный интерфейс Siri, а в дальнейшем может быть интегрирована в браузер Safari и поисковую систему Spotlight. При этом внутри Apple продолжается тестирование технологии искусственного интеллекта (ИИ), в ходе которого выяснится, будут ли в основе нового поколения Siri использоваться собственные ИИ-алгоритмы компании или же технологии от внешних партнёров — таких как Google, Anthropic или OpenAI.

Несмотря на то, что разработка продукта началась лишь несколько месяцев назад, выбор партнёров не повлияет на сроки запуска нового Siri на собственном движке WKA, что, вероятно, произойдёт в марте 2026 года.

Google тайком удалила обещание стать углеродно-нейтральной к 2030 году — всему виной аппетиты ИИ

Google тихо удалила упоминание о цели по достижению нулевых выбросов углерода к 2030 году с главной страницы своего раздела об устойчивом развитии. Изменение совпало с резким ростом энергопотребления в связи со строительством дата-центров для искусственного интеллекта (ИИ).

 Источник изображения: Copilot

Источник изображения: Copilot

Как пишет Tom's Hardware со ссылкой на канадское издание National Observer, компания переименовала раздел «Устойчивое развитие» и убрала заголовок, декларирующий эту амбициозную цель. Вместо этого акцент сместился на экологичность новых аппаратных решений, например, на использовании переработанного алюминия в смартфонах Google Pixel, при этом без упоминания общей углеродной политики компании.

Представитель Google в своём заявлении подтвердил, что цель на 2030 год остаётся в силе. Он отметил, что по данным последнего отчёта компании, выбросы от центров обработки данных сократились на 12 % в 2024 году благодаря подключению новых источников чистой энергии, несмотря на растущие потребности. Однако на странице, посвящённой устойчивому развитию ЦОДов, формулировка вокруг обязательства изменились, теперь это подаётся скорее как смелая цель, а не как гарантия.

На исчезновение формулировки на сайте об устойчивом развитии, по мнению экспертов, вероятно, повлияли два фактора: стремительный рост энергозатрат из-за масштабирования ИИ-инфраструктуры и смена курса климатической политики в США при администрации Дональда Трампа (Donald Trump). Также в прошлом году Google сообщила, что выбросы парниковых газов компании выросли на 48 % и в основном из-за строительства новых дата-центров под ИИ, что, по признанию Google, ставит под вопрос достижимость цели 2030 года. В свою очередь, американская администрация, убрав ряд государственных сайтов, посвящённых изменению климата, начала продвигать концепцию «супер чистых» угольных электростанций.

Теперь, когда Google официально рассматривает свои климатические планы скорее как долгосрочную цель с неопределённым исходом, чем как твёрдое обязательство, дальнейшая стратегия компании в этой сфере, видимо, будет корректироваться.

Google запустила ИИ-клавиатуру Gboard для всех пользователей Android

Google выпустила масштабное обновление для пользователей Android в рамках релиза Android 16 QPR1, внедрив ИИ-инструменты экранной клавиатуры Gboard на всех поддерживаемых устройствах и представив интерфейс для функции Quick Share. Ранее доступные только для смартфонов Pixel 10 функции умного редактирования текста теперь стали доступны всем владельцам Android-устройств.

 Источник изображения: Google

Источник изображений: Google

Новые инструменты для написания текста в Gboard позволяют проверять текст, перефразировать его или добавлять больше деталей, при этом вся обработка происходит локально, без передачи данных в облако. Как отмечают в Google, хотя не каждому пользователю это пригодится, те, кто хочет сделать своё сообщение более профессиональным или, наоборот, более непринуждённым, найдут эту функцию полезной. Кроме того, ИИ-инструмент Gboard, анонсированный в прошлом месяце, теперь доступен на смартфонах других производителей.

Ещё более интересным нововведением стал редизайн функции Quick Share, ранее известной как Nearby Share и предназначенной для быстрой и удобной передачи файлов. Quick Share включает отдельные вкладки для отправки и приёма файлов, упрощая выбор учётной записи, поиск подключённых устройств и передачу нескольких файлов одновременно. Вкладка «Получить» особенно удобна, так как отображает индикаторы прогресса загрузки, позволяет быстро отменить передачу или просмотреть содержимое, загружающееся на устройство пользователя.

Также Google официально запустила навигацию по стикерам из Emoji Kitchen, ранее замеченную в тестовых сборках ещё весной. Теперь можно просматривать доступные комбинации стикеров без необходимости первоначального выбора двух разных эмодзи для создания нового уникального гибридного стикера. По данным 9to5Google, функция уже могла быть предустановлена на некоторых устройствах, но теперь активна для всех.

Дополнительно вводится поддержка совместного прослушивания аудио через Bluetooth на устройствах с поддержкой LE Audio (стандарт для беспроводной передачи звука, построенный на базе Bluetooth Low Energy), что позволяет пользователям синхронно транслировать звук сразу на несколько гарнитур.

Команда специалистов Meta✴ по ИИ, на которую Цукерберг потратил миллиарды долларов, уже трещит по швам

В июне этого года Meta✴ вложила $14,3 млрд в капитал компании Scale AI, но главным приобретением по итогам этой сделки принято считать переход под крыло Марка Цукерберга (Mark Zuckerberg) её основателя Александра Вана (Alexandr Wang). Попытки сформировать костяк команды по разработке ИИ на основе крупных специалистов из других компаний, как отмечает TechCrunch, уже показывают несостоятельность инициативы.

 Источник изображения: Unsplash, Bojun Liu

Источник изображения: Unsplash, Bojun Liu

Поводом для источника говорить о наличии проблем с лояльностью у вновь испечённых сотрудников Meta✴ стало решение старшего вице-президента Scale AI Рубена Мэйера (Ruben Mayer) покинуть компанию всего через два месяца после перехода на новую работу. В Scale AI он потратил в общей сложности пять лет, а на новом месте в Meta✴ курировал работу команд, имеющих отношение к ИИ, но не вошёл в состав TBD Labs — вновь созданного подразделения, которое должно создавать сильный искусственный интеллект. При этом в эту команду вошли многие видные специалисты OpenAI, которых удалось переманить Цукербергу.

Сам Мэйер в комментариях TechCrunch пояснил, что его роль в Meta✴ сводилась к общим организационным вопросам, непосредственно с данными и разработками она взаимодействовать не позволяла. Он также утверждает, что с первого дня был частью команды TBD Labs. На новом месте работы он не подчинялся непосредственно Александру Вану и был весьма доволен новым назначением, а покинуть компанию в сжатые сроки его вынудили «личные причины». Впрочем, для теперь уже бывшего работодателя это вряд ли сильно меняет результат.

Примечательно, что после покупки крупного пакета акций Scale AI компания Meta✴ продолжает пользоваться услугами её конкурентов в сегменте маркировки данных для систем ИИ — Mercor и Surge. Инвестиции в Scale AI, по мнению некоторых источников, не особо влияют на ситуацию, поскольку представители TBD Labs считают её услуги не столь качественными, отдавая предпочтение решениям конкурентов. Исторически Scale AI использовала модель краудсорсинга и не очень-то тратилась на обработку данных, но современная конъюнктура рынка отдаёт предпочтение более качественным участникам процесса маркировки данных, которые являются экспертами в своей области. Это требует более высоких затрат на обработку массивов информации. Конкуренты движутся вперёд более уверенными темпами, чем Scale AI, которая вынуждена их догонять. Представители Meta✴ открыто отказываются признавать наличие проблем с качеством услуг Scale AI.

Ситуация усугубляется тем, что если Meta✴ не ограничивает себя в работе с конкурентами Scale AI, то сохранившая частичную самостоятельность Scale AI столкнулась с отказом OpenAI и Google продолжать сотрудничество с ней после сделки с Meta✴. В июле Scale AI пришлось уволить около 200 сотрудников на направлении маркировки данных. Компания сохраняет надежду, что расширит штат на других направлениях деятельности.

Не все руководители Scale AI после сделки с Meta✴ получили значимые кадровые позиции в структуре последней. Расширение штата специалистов ИИ компании Meta✴, как отмечают некоторые бывшие и настоящие сотрудники, происходит всё более хаотично, а некоторых «новобранцев» пугают бюрократические трудности, присущие большой корпорации, коей является Meta✴ Platforms. Она не только переманивала ценных специалистов у конкурентов в последние месяцы, но и заявила о готовности вложить десятки миллиардов долларов в строительство вычислительной инфраструктуры в США.

На определённом этапе Марк Цукерберг понял, что Александр Ван является не лучшим кандидатом на руководство профильной лабораторией по разработке ИИ, поскольку он не обладает профильной подготовкой. При этом попытки привлечь на эту роль других кандидатов из конкурирующих стартапов успехом не увенчались. Некоторые выходцы из OpenAI, которых Meta✴ переманила, уже успели покинуть компанию. Уволились и некоторые сотрудники Meta✴, которые занимались разработкой генеративного искусственного интеллекта до всех этих структурных изменений. Часть из них на полном соблазнов рынке труда просто ухватилась за другие шансы.

xAI Илона Маска представила ИИ для программирования, который отвечает мгновенно

Компания xAI Илона Маска (Elon Musk), представила новую модель искусственного интеллекта для задач программирования под названием Grok Code Fast 1. Модель, которую компания описывает как «быструю и экономичную», призвана сократить время на медленные циклы обработки, характерные для других ИИ-ассистентов.

 Источник изображения: Mariia Shalabaieva/Unsplash

Источник изображения: Mariia Shalabaieva/Unsplash

Grok Code Fast 1 построена на новой архитектуре, для предварительного обучения которой был специально сформирован массив данных, содержащий готовый к применению программный код. Дополнительно модель была дообучена на реальных запросах на внесение изменений в код (Pull Request, PR) и эталонных задачах по написанию кода, что, по утверждению xAI, позволило адаптировать её к практическому использованию. Система обучена работе с такими инструментами и командами, как grep (глобальный поиск регулярных выражений), терминал и редакторы файлов, что делает её пригодной для интеграции в повседневные рабочие процессы внутри популярных интегрированных сред разработки (IDE).

Модель поддерживает несколько языков программирования, включая TypeScript, Python, Java, Rust, C++ и Go. Компания заявляет, что Grok Code Fast 1 способна создавать проекты с нуля, отвечать на сложные вопросы по структуре кодовой базы и исправлять ошибки при минимальном участии разработчика. На тестовом наборе SWE-Bench-Verified, который широко используется для оценки возможностей ИИ в программировании, модель показала результат в 70,8%. При этом в xAI подчёркивают, что ключевую роль в формировании функциональности сыграла обратная связь от реальных разработчиков.

Особое внимание xAI уделила отзывчивости модели. Благодаря новым методам обслуживания и оптимизации кеширования она может практически мгновенно выполнять множественные вызовы инструментов, что позволяет разработчикам видеть результаты в реальном времени без задержек. Главный директор по продукту GitHub Марио Родригес (Mario Rodriguez) отметил в ходе тестирования и скорость, и качество модели в решении агентных задач кодирования, добавив, что эта разработка представляет собой убедительную новую опцию для разработчиков.

xAI подтвердила, что планирует регулярно обновлять Grok Code Fast 1, внедряя улучшения в течение нескольких дней, а не недель. Уже ведётся обучение новой версии модели, которая получит поддержку параллельных вызовов инструментов и увеличенной длины контекста. Как отмечает eWeek, тем самым xAI вступает в гонку с такими компаниями, как Microsoft (с GitHub Copilot) и OpenAI (с Codex), активно развивающими направление автономных ИИ-ассистентов для разработчиков.

Для привлечения первых пользователей модель будет доступна бесплатно в течение одной недели через партнёрские платформы, включая GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, Opencode и Windsurf. По истечении пробного периода стоимость использования через API xAI составит $0,20 за миллион входных токенов, $1,50 за миллион выходных токенов и $0,02 за миллион закешированных входных токенов. xAI также опубликовала руководство по созданию эффективных промптов для Grok Code Fast.

Хакер сделал конкурента ChatGPT соучастником вымогательской кампании: ИИ искал уязвимости и писал угрозы

Компания Anthropic раскрыла детали беспрецедентной хакерской атаки, в которой злоумышленник использовал её ИИ-ассистента для полной автоматизации масштабной кампании по краже данных с целью вымогательства. Инцидент затронул не менее 17 организаций, включая государственные учреждения, больницы, экстренные службы, религиозные организации и подрядчика оборонной отрасли.

 Источник изображения: Max Bender/Unsplash

Источник изображения: Max Bender/Unsplash

По сообщению PCMag, хакер автоматизировал атаку, использовав агентную среду выполнения Claude Code для поиска уязвимостей, сбора учётных данных и проникновения в защищённые сети организаций. ИИ помог злоумышленнику похитить личные записи, включая медицинские данные, финансовую информацию и правительственные идентификационные документы. Затем Claude проанализировал их на предмет размера выкупа, который варьировался от 75 000 до 500 000 долларов в биткоинах, а также сгенерировал визуально пугающие тексты с требованиями, отображавшиеся на компьютерах жертв.

Несмотря на встроенные средства защиты, хакер смог обойти ограничения, загрузив в чат файл конфигурации с легендой о проведении тестирования сетевой безопасности якобы по официальному контракту. Этот файл содержал детальные методики атак и схемы последовательности выполнения задач на основе их значимости. В ходе всего процесса Claude использовался для сканирования уязвимых сетей с высоким процентом успеха, а также для создания вредоносного программного обеспечения и других инструментов, предназначенных для обхода защитных механизмов антивирусной программы Windows Defender.

В отличие от предыдущих случаев, когда ИИ применялся хакерами лишь для вспомогательных задач, таких как написание фишинговых писем или анализ уязвимостей, в данном инциденте ИИ-модель выступала не только консультантом, но и активным исполнителем атак. Представители Anthropic подчеркнули, что это «свидетельствует о новом этапе в развитии киберпреступности с участием искусственного интеллекта, когда ИИ становится полноценным оператором в цепочке атак».

Компания ожидает, что всё больше хакеров будут применять подобные методы. В том же отчёте упоминается о другом, возможно начинающем злоумышленнике, который использовал Claude для разработки, продвижения и продажи нескольких вариантов программ-вымогателей. По словам Anthropic, данный пользователь был полностью зависим от ответов ИИ и без помощи Claude не смог бы реализовать или устранить неполадки ключевых компонентов вредоносного ПО.

Отдельно сообщается, что компания-разработчик антивирусного программного обеспечения ESET также обнаружила новую программу-вымогателя, использующую открытую модель OpenAI для генерации злонамеренного кода на заражённых устройствах.


window-new
Soft
Hard
Тренды 🔥
«Жидкое стекло» Apple можно будет заматировать: представлена нова бета iOS 26.1 12 мин.
Сервисы AWS упали второй раз за день — тысячи сайтов по всему миру снова недоступны 8 ч.
Fujitsu влила £280 млн в британское подразделение в преддверии выплат компенсаций жертвам багов в её ПО Horizon 8 ч.
Календарь релизов 20 – 26 октября: Ninja Gaiden 4, Painkiller, Dispatch и VTM – Bloodlines 2 8 ч.
В Windows сломалась аутентификация по смарт-картам после октябрьских обновлений — у Microsoft есть временное решение 9 ч.
Вместо Majesty 3: российские разработчики выпустили в Steam амбициозную фэнтезийную стратегию Lessaria: Fantasy Kingdom Sim 9 ч.
Слухи: Лана Дель Рей исполнит заглавную песню для «Джеймса Бонда», но не в кино, а в игре от создателей Hitman 10 ч.
Зов сердца: разработчики Dead Cells объяснили, почему вместо Dead Cells 2 выпустили Windblown 11 ч.
Adobe запустила фабрику ИИ-моделей, заточенных под конкретный бизнес 11 ч.
Китай обвинил США в кибератаках на Национальный центр службы времени — это угроза сетям связи, финансовым системам и не только 12 ч.
Президент США подписал соглашение с Австралией на поставку критически важных минералов на сумму $8,5 млрд 18 мин.
Новая статья: Обзор смартфона realme 15 Pro: светит, но не греется 5 ч.
Ещё одна альтернатива платформам NVIDIA — IBM объединила усилия с Groq 5 ч.
Учёные создали кибер-глаз, частично возвращающий зрение слепым людям 6 ч.
Samsung выпустила недорогой 27-дюймовый геймерский монитор Odyssey OLED G50SF c QD-OLED, 1440p и 180 Гц 6 ч.
Акции Apple обновили исторический максимум на новостях об отличных продажах iPhone 17 8 ч.
Представлен флагман iQOO 15 с чипом Snapdragon 8 Elite Gen 5 и батареей на 7000 мА·ч по цене меньше $600 9 ч.
Нечто из космоса врезалось в лобовое стекло самолёта Boeing 737 MAX компании United Airlines 10 ч.
Умные кольца Oura научатся выявлять признаки гипертонии, как последние Apple Watch 11 ч.
Дешёвая корейская термопаста оказалась вредна для процессоров и здоровья пользователей 11 ч.