Сегодня 19 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → робототехника
Быстрый переход

Meta✴ разработала «мировую ИИ-модель» V-JEPA 2: она понимает законы физики, а не только слова

Компания Meta✴ объявила о запуске новой ИИ-модели V-JEPA 2, предназначенной для улучшения понимания физического мира роботами и автономными транспортными средствами. Модель способна анализировать трёхмерное пространство и предсказывать поведение объектов без необходимости использования больших объёмов данных.

 Источник изображений: ***

Источник изображений: Meta✴

V-JEPA 2 может, например, определить, что мяч, скатившийся со стола, упадёт на пол, или что объект, скрытый из виду, не исчез, а просто находится вне зоны видимости. Это позволяет модели формировать внутреннее представление о реальности и принимать решения с учётом физических законов. Разработка позиционируется как шаг к созданию систем, способных не просто обрабатывать информацию, а планировать свои действия.

По словам Яна ЛеКюна (Yann LeCun), главного научного руководителя по искусственному интеллекту в Meta✴, понимание физического мира требует принципиально иного подхода, нежели обработка естественного языка. «Позволить машинам понимать физический мир — это совсем не то же самое, что позволить им понимать речь человека», — отметил ЛеКюн. Он также добавил, что модель выступает своего рода абстрактным цифровым двойником реальности, который помогает ИИ предсказывать последствия своих действий.

Технология может применяться в сервисах доставки роботами и беспилотных автомобилях, которым необходимо мгновенно интерпретировать происходящее вокруг. По данным CNBC, в рамках развития ИИ-стратегии, а также в условиях конкуренции с OpenAI, Microsoft и Google, глава Meta✴ Марк Цукерберг (Mark Zuckerberg) также планирует инвестировать $14 млрд в компанию Scale AI, генеральным директором и основателем которой является Александр Ванг (Alexandr Wang).

Учёные натренировали робопса играть в бадминтон — он самообучается, но пока играет на уровне любителя

Группа учёных из ETH Zürich под руководством робототехника Юньтао Ма (Yuntao Ma) представила робота, способного играть в бадминтон. Робот ANYmal внешне напоминает миниатюрного жирафа с ракеткой «в зубах», и создан на базе четвероногого промышленного робота, предназначенного для работы в нефтегазовой отрасли, от компании ANYbotics. Вес ANYmal составляет около 50 кг, длина корпуса — менее метра, а ширина — менее 50 сантиметров.

 Источник изображений: ETH Zürich

Источник изображений: ETH Zürich

На робота установлен манипулятор с несколькими степенями свободы, в который закреплена бадминтонная ракетка. Отслеживание полёта волана и мониторинг окружающей среды осуществляется с помощью стереоскопической камеры. По словам разработчиков, на создание робота ушло около пяти лет.

При разработке системы управления ANYmal были использованы современные методы обучения моделей ИИ с подкреплением. «Вместо того чтобы строить продвинутые модели, мы смоделировали робота в виртуальной среде и позволили ему научиться двигаться самостоятельно», — пояснил Ма. Обучение разбивалось на повторяющиеся блоки, в каждом из которых робот должен был предсказать траекторию полёта волана и попытаться его отбить. В ходе этого процесса ANYmal, как настоящий спортсмен, также определял пределы своих физических возможностей.

 Источник изображений: ETH Zürich

Обучение было направлено на развитие зрительно-моторной координации, аналогичной той, которой обладают спортсмены-люди. Модель восприятия, основанная на данных с камеры в реальном времени, обучала робота удерживать волан в поле зрения, несмотря на помехи и ошибки отслеживания. «Представьте, что робот занимает позицию для приёма волана, — рассказал Ма. — Если он движется медленно, шансы на успех снижаются. Если быстро — тряска камеры увеличивает погрешность отслеживания. Это компромисс, и мы хотели, чтобы он научился с ним справляться».

В результате обучения с подкреплением робот освоил принципы правильного позиционирования на площадке. Он пришёл к выводу, что после удачного удара наилучшая стратегия — возврат в центр площадки к задней линии. ANYmal научился самостоятельно вставать на задние «лапы», чтобы лучше видеть приближающийся волан, понял, как избегать падений и оценивать разумность риска с учётом своей ограниченной скорости. Он также воздерживался от попыток, заведомо обречённых на неудачу, тем самым снижая вероятность повреждений.

 Источник изображений: ETH Zürich

Результаты реальных матчей с людьми показали, что ANYmal как бадминтонист пока что не более чем любитель. Его время реакции составляло около 0,35 секунды, в то время как средний человек реагирует за 0,2–0,25 секунды, а элитные игроки с натренированными рефлексами и развитой мышечной памятью сокращают это время до 0,12–0,15 секунды. Ещё одной проблемой является ограниченное поле зрения камеры робота.

Учёные планируют продолжать развитие навыков ANYmal. В частности, они намерены сократить время реакции путём предсказания траектории волана на основе позы соперника перед ударом. Также предполагается оснастить робота более продвинутыми камерами со сверхнизкой задержкой. Модернизации потребуют и приводы манипуляторов.

Сам по себе робот, играющий в бадминтон, — скорее курьёз, чем практическое устройство. Однако опыт, полученный в процессе разработки, может быть масштабирован для самых разных задач. «Я думаю, что предлагаемая нами архитектура обучения будет полезна в любом приложении, где необходимо балансировать между восприятием и управлением — например, при подъёме предметов, а также их ловле и броске», — заключил Ма.

Figure похвалилась успехами человекоподобного робота Helix на работе, но посылки продолжают летать по складу

Три месяца назад робототехнический стартап Figure «устроил на работу» в почтовое отделение своего передового гуманоидного робота Helix. Сегодня представители компании подробно рассказали о накопленном за это время опыте и успехах робота в сортировке посылок. Однако при просмотре опубликованного компанией почти часового видеоролика мы заметили множество ошибок, совершаемых Helix. Пожалуй, свои посылки мы ему пока доверить не готовы.

 Источник изображений: Figure

Источник изображений: Figure

«Теперь Helix может обрабатывать более широкий спектр упаковок и приближается к ловкости и скорости человеческого уровня, приближая нас к полностью автономной сортировке посылок. Этот быстрый прогресс подчёркивает масштабируемость основанного на обучении подхода Helix к робототехнике, который быстро переносится в реальное применение», — так оценил успехи робота представитель Figure. По его словам, за счёт масштабирования данных и усовершенствования архитектуры возможности Helix существенно повысились:

  • Освоены новые типы упаковок, такие как полиэтиленовые пакеты и плоские конверты.
  • Пропускная способность возросла на 20 % до 4,05 секунд на упаковку при сохранении точности.
  • Улучшилось распознавание штрих-кодов с 70 до 95 процентов.
  • Робот демонстрирует адаптивное поведение, разглаживая складки для улучшения считывания штрих-кодов.
  • Модуль памяти зрения обеспечивает Helix доступ к истории прошлых состояний.
  • Обратная связь по усилию обеспечивает более точный захват и манипулирование посылками.

Помимо стандартных жёстких коробок система теперь обрабатывает полиэтиленовые пакеты, мягкие конверты и другие деформируемые или тонкие посылки. Эти предметы могут складываться, мяться или изгибаться, что затрудняет захват и распознавание этикеток. Helix решает эту задачу, корректируя стратегию захвата на лету — например, отбрасывая мягкий пакет для его динамического переворота или используя специальные захваты для плоских почтовых отправлений.

Робот должен поворачивать упаковку штрих-кодом вниз для сканирования. Helix старается расправить пластиковую упаковку, чтобы сканер смог успешно считать штрих-код. Такое адаптивное поведение подчёркивает преимущества сквозного обучения — робот выполняет действия, которые не были жёстко запрограммированы, чтобы компенсировать несовершенства упаковки.

Многие достижения стали возможны благодаря целенаправленным улучшениям визуально-моторной политики робота. Он получил новые модули памяти и машинного зрения, что позволило ему лучше воспринимать состояние окружающей среды и быстро адаптироваться к изменениям ситуации.

Helix оснащён модулем неявной визуальной памяти, который обеспечивает поведение с учётом текущего состояния — робот запоминает, какие стороны упаковки он уже осмотрел, либо какие зоны конвейера свободны. Модуль памяти помогает устранять избыточные движения, давая Helix ощущение временного контекста и позволяя ему действовать более стратегически при выполнении многошаговых манипуляций.

Отслеживание истории недавних состояний позволяет роботу осуществлять более быстрое и реактивное управление. В результате ускоряется реакция на неожиданности и помехи: если пакет смещается или попытка захвата оказывается неудачной, Helix корректирует движение «на лету». Это значительно сократило время обработки каждого пакета.

Helix использует аналог человеческого осязания благодаря интегрированной обратной связи по усилию. Робот способен определить момент соприкосновения с объектом и использовать это для модуляции движения, например, приостанавливая опускание при контакте с конвейерной лентой.

Хотя основной задачей Helix в логистическом сценарии является автономная сортировка, он легко адаптируется к новым взаимодействиям. Например, протянутая к нему рука человека интерпретируется как сигнал к передаче предмета: робот отдаёт посылку, а не размещает её на конвейере — подобное поведение заранее явно не программировалось, система самостоятельно обучилась ему.

 Источник изображений: Figure

«Helix неуклонно масштабируется в плане ловкости и надёжности, сокращая разрыв между освоенными роботизированными манипуляциями и требованиями реальных задач. Мы продолжим расширять набор навыков и обеспечивать стабильность на ещё больших скоростях и рабочих нагрузках», — заявил представитель Figure.

В реальности всё далеко не так радужно, как описывают маркетологи Figure — по следующим ссылкам можно увидеть, что робот совершает много ошибок, путается, роняет посылки и порой откровенно зависает. Так что какое-то время «кожаные мешки» на этой работе ещё будут востребованы. Но, учитывая нынешние темпы развития робототехники и бум искусственного интеллекта, почтовым служащим пора подумать о смене профессии.

В Китае пройдёт первый в истории чемпионат по боям человекоподобных роботов

Первый в истории турнир по боям полноразмерных человекоподобных роботов пройдёт в китайском городе Шэньчжэне, который расположен в провинции Гуандун на юго-востоке страны. Турнир EngineAI Robot Free Combat Tournament: «Mecha King» знаменует важную веху в индустрии робототехники и призван расширить границы искусственного интеллекта, стимулируя модернизацию промышленности и масштабное использование роботов.

 Источник изображения: globaltimes.cn

Источник изображения: globaltimes.cn

По словам организаторов, мероприятие призвано проверить физические возможности и уровень интеллекта роботов в захватывающих боевых сценариях. На турнире также представят новые правила боёв человекоподобных роботов, которые будут требовать имитации естественных движений человека и принятия продуманных решений в сложных условиях в режиме онлайн.

Робототехническая компания EngineAI из Шэньчжэня предоставит для турнира несколько моделей роботов-гуманоидов. Компания планирует сделать открытым код программного обеспечения роботов, благодаря чему команды-участницы турнира смогут детально настроить и даже дообучить своих бойцов.

Соучредитель EngineAI Яо Айвэн (Yao Aiwen) в беседе с журналистами рассказал, что одна из целей турнира заключается в создании более сильных, проворных и умных роботов. Компания намерена задействовать развитую экосистему робототехники в районе Большого залива Гуандун-Гонконг-Макао и интегрировать спорт с ИИ-технологиями для достижения прорыва в ключевых направлениях, таких как восприятие роботов, принятие решений и исполнение команд. Он также сказал, что бойцовский турнир поможет проверить способность роботов к обучению. Когда роботы смогут танцевать, заниматься спортом и выполнять другие действия, их будет проще использовать в повседневной жизни и на производстве. Это ускорит широкомасштабное внедрение человекоподобных роботов в промышленности, сфере услуг, медицине и др., а также откроет путь для развития интеллектуальной экономики.

Помимо мероприятия в Шэньчжэне, человекоподобные роботы готовятся к первому в мире соревнованию по боевым искусствам, которое состоится 25 мая в Ханчжоу, расположенном в провинции Чжэцзян. Мероприятие включает в себя демонстрационную и соревновательную части, в ходе которых роботы-гуманоиды продемонстрируют боевые приёмы, а управляемые людьми роботы проведут несколько спаррингов. Основным партнёром соревнований стала робототехническая компания Unitree Robotics из Ханчжоу, инженеры которой провели масштабную подготовку роботов, уделяя особое внимание способности балансировать и сохранять равновесие. Роботы прошли серию стресс-тестов, доказав свою готовность к предстоящему мероприятию.

Оба соревнования отражают широкое развитие робототехники в Китае. По данным правительства Чжэцзян, в Ханчжоу работают более 200 компаний, связанных с робототехникой, а объём производства роботов в 2024 году составил 15 млрд юаней. Объём производства промышленных роботов в Гуандуне в 2024 году превысил 240 тыс. единиц или комплектов, что говорит о росте на 31,2 % год к году. По данным агентства Синьхуа, каждый третий промышленный робот в Китае сейчас производится в Гуандуне.

Hyundai автоматизирует до 40 % автосборочных операций к концу года на своём предприятии в США при помощи роботов Boston Dynamics

Потребность в локализации производства транспортных средств в США обострилась ещё при президенте Байдене, поскольку электромобили выгоднее производить в непосредственной близости к рынку сбыта. Тарифы Трампа лишь усугубляют ситуацию, поэтому Hyundai на своём предприятии в Джорджии намеревается к концу года довести долю роботизированных сборочных операций до 40 %.

 Источник изображения: Boston Dynamics

Источник изображения: Boston Dynamics

Данное решение пересекается с избранным корейским автопроизводителем курсом на закупку десятков тысяч роботов Boston Dynamics для использования в соответствующих целях на всех прочих предприятиях. Напомним, что этот разработчик передовых роботов с 2021 года на 80 % принадлежит Hyundai, поэтому подобная кооперация вполне объяснима.

Как сообщает Nikkei Asian Review со ссылкой на представителей Hyundai Motor, к концу текущего года компания намерена довести долю роботизированных сборочных операций на своём предприятии в штате Джорджия до 40 %, для чего уже начинает внедрять на этой площадке человекоподобных роботов Atlas. Ему будут поручены операции, в данный момент выполняемые людьми, как то перемещение грузов и установка дверей на автомобили.

Будет расширено применение и промышленных роботов, а также прочих «помощников» из ассортимента продукции Boston Dynamics, включая робопсов, за которыми закрепят функции наблюдения и инспекции. До сих пор автосборочные операции считались плохо подлежащими автоматизации, но Hyundai надеется поднять планку до 50 %. Обработка деталей давлением и сварка также будет автоматизирована. В марте руководство компании заявило, что на протяжении ближайших четырёх лет потратит на развитие производства в США около $21 млрд. Предприятие в Джорджии первоначально сможет выпускать по 100 000 электромобилей и гибридов ежегодно, но со временем это количество увеличится в пять раз.

Попутно будет расширяться и автосборочное предприятие Hyundai в Алабаме, что в конечном итоге позволит компании собирать в США по 1,2 млн машин ежегодно. Это на 70 % больше, чем планируется выпустить по итогам текущего года. Для Hyundai Северная Америка является крупнейшим рынком сбыта, и если в прошлом году мировые продажи автомобилей этого концерна сократились на 2 % до 7 млн штук, в данном регионе они выросли на 4 % до 1,9 млн штук. Местный рынок помог Hyundai получить рекордную выручку по итогам прошлого года, но основная часть реализуемых машин продолжает завозиться из Южной Кореи, что делает бизнес компании уязвимым по отношению к импортным пошлинам, повышаемым Дональдом Трампом. Пока Hyundai рассчитывает удержать свои цены в США на существующем уровне как минимум до июня текущего года.

Российские компании за внедрение роботов получат 20 % кешбэка от Минпромторга

Минпромторг будет возмещать компаниям 20 % расходов на внедрение роботов на российских производствах, сообщили «Ведомости» со ссылкой на решение ведомства. Конкурсный отбор на субсидирование этого направления начнётся в конце апреля — соответствующее объявление появится на сайте Государственной информационной системы промышленности, где публикуется информация о мерах господдержки.

 Источник изображения: ЧКПЗ

Источник изображения: ЧКПЗ

Заявку на получение кешбэка на внедрение роботов смогут подать российские компании обрабатывающей промышленности с долей иностранного капитала менее 25 %, не являющиеся иностранными агентами и не находящиеся в стадии банкротства.

Для получения субсидии компаниям необходимо будет отчитаться о внедрении роботов, при этом их количество не будет иметь значения. В случае непредоставления отчёта после получения кешбэка организации грозит штраф в размере 1/360 от ключевой ставки ЦБ за каждый день просрочки. Если же компания не выполнит задачу по внедрению роботов, она обязана будет вернуть кешбэк в бюджет.

О необходимости субсидирования роботизации ещё в прошлом году заявил заместитель директора департамента станкостроения и тяжёлого машиностроения Минпромторга Александр Львов. Он отметил, что для вхождения России в топ-25 стран по плотности роботизации необходима господдержка, аналогичная той, что действует на китайском рынке, где компенсируют до 50 % затрат на это направление.

Кешбэк на роботов включён в перечень мер по реализации федерального проекта «Развитие промышленной робототехники и автоматизации производства». На его реализацию из госбюджета до 2030 года выделено около 350 млрд руб., а основная цель программы — увеличение числа промышленных роботов на предприятиях до 99 325 единиц за этот период. О необходимости развития роботизации говорил Владимир Путин на ПМЭФ-2024.

Генеральный директор «Дронсхаб Групп» Максим Томских назвал государственное субсидирование эффективным решением, однако отметил, что кешбэк предусмотрен для внедрения любой робототехники, не обязательно отечественной. В связи с этим «массовое стремление купить в Китае подешевле» может помешать развитию российского производства.

Того же мнения придерживается руководитель направления робототехники компании B2B Services Максим Абрамов. Он считает, что размер субсидии должен зависеть от происхождения роботов: например, для локализованной продукции российских вендоров она могла бы составлять 50–60 %, для китайских — 30 %, а для европейских — 10–20 %. В свою очередь, основатель «Завода роботов» Андрей Гартунг считает, что субсидирование закупок роботов у любых производителей будет способствовать честной конкуренции.

Исполнительный директор Национальной ассоциации участников рынка робототехники Ольга Мудрова отметила, что при нынешней ключевой ставке ЦБ в 21 % субсидия в 20 % вряд ли покроет затраты на внедрение роботов. Поэтому кешбэк необходимо подкреплять другими мерами господдержки, такими как льготный лизинг и кредитование.

Китайцы готовы обогнать Tesla и Boston Dynamics в наполнении мира человекоподобными роботами

Компанию Tesla и нашедшего себе южнокорейского инвестора стартап Boston Dynamics принято считать потенциальными лидерами рынка человекоподобных роботов в США Но китайские компании стремительно приближаются к статусу мировых лидеров, и имеют все шансы повторить успех рынка электромобилей в сегменте человекоподобных роботов, как считают аналитики.

Их комментарии приводит издание CNBC. По мнению представителей SemiAnalysis, в случае подобного масштабного успеха китайских компаний в сфере разработки и производства человекоподобных роботов, влияние на мировой рынок труда может оказаться колоссальным. Китайские производители имеют возможность снижать издержки за счёт масштабов бизнеса, поэтому у зарубежных конкурентов не так много шансов превзойти их на рынке человекоподобных роботов. По оценкам Morgan Stanley, себестоимость выпуска человекоподобного робота сейчас лежит в диапазоне от $10 000 до $300 000 за штуку, в зависимости от функциональных возможностей и технических требований.

Ещё в мае прошлого года китайская Unitree начала предлагать человекоподобных роботов за $16 000. При этом специалисты Morgan Stanley оценивают розничную стоимость Tesla Optimus в $20 000, и на эту же сумму предлагал ориентироваться сам Илон Маск (Elon Musk). Впрочем, без доступа к китайской компонентной базе Tesla вряд ли сможет удержать стоимость своего человекоподобного робота на этом уровне, как считают эксперты.

За последние пять лет китайские разработчики зарегистрировали 5688 патентов, в которых фигурирует слово «человекоподобный», тогда как у компаний из США этот показатель едва достиг 1483 патентов. Китайские автопроизводители активно включаются в процесс освоения рынка человекоподобных роботов. О соответствующих амбициях уже заявили Xiaomi, BYD, Chery и XPeng. Кроме того, в Китае полно и специализированных стартапов, которые изначально нацелены на выпуск человекоподобных роботов. Китайским компаниям помогает и государство, как поясняют аналитики Morgan Stanley.

Человекообразные роботы в ближайшие три или четыре года начнут активнее использоваться на производстве, поскольку там проще обеспечить однородное и предсказуемое окружение. Позже они начнут проникать в бытовую и сервисную сферы. Тот же Илон Маск рассчитывает поручить своим роботам Optimus ряд операций на предприятиях Tesla уже в этом году, причём речь идёт о тысячах экземпляров. Китайские автопроизводители тоже начали тестировать человекоподобных роботов на своих предприятиях.

Поскольку Китай обеспечивает себя компонентами для производства роботов примерно на 70 %, рост масштабов производства стремительно снизит себестоимость продукции. Тот же Unitree G1 вообще не использует комплектующих американского происхождения. Американским производителям о таком уровне суверенитета только приходится мечтать. По прогнозам Bank of America, к 2030 году в мире будет ежегодно продаваться по 1 млн человекоподобных роботов, а к 2060 году количество эксплуатируемых роботов такого типа вырастет до 3 млрд штук.

Российские промышленные роботы получат стандарт ПО — его разработает Минпромторг с «Яндексом» и «Сбером»

Минпромторг совместно с «Яндексом» и «Сбером» разрабатывает унифицированный стандарт ПО для промышленных роботов, который должен быть представлен к лету этого года, сообщил начальник отдела департамента станкостроения и тяжёлого машиностроения Минпромторга Руслан Ахмедов на круглом столе «Промышленная роботизация в России», о чём пишут «Ведомости».

 Источник изображения: Gabriele Malaspina/unsplash.com

Источник изображения: Gabriele Malaspina/unsplash.com

По словам Ахмедова, в Минпромторге решили разделить производство роботов и разработку ПО для них в рамках федерального проекта «Развитие промышленной робототехники и автоматизации производства», на который выделено около 350 млрд руб. из госбюджета до 2030 года.

Глава государства поставил перед отраслью цель увеличить количество промышленных роботов до 99 325 шт. на предприятиях до 2030 года с имеющихся в настоящее время 14 382 (согласно статистике Минпромторга). По данным ведомства, средняя плотность роботизации в мире составляет 162 робота на 10 тыс. рабочих, в то время как в России этот показатель равен 19.

Ранее в этом месяце «Ведомости» сообщили, что в России в сфере робототехники заняты 73 компании, из которых 19 осуществляют выпуск роботов, 56 предоставляют услуги по интеграции, а пять выпускают комплектующие. Как сообщил Ахмедов на круглом столе, Минпромторг поставил задачу обеспечить России присутствие в топ-25 стран по плотности роботизации. Для этого необходимо внедрить более 85 тыс. промышленных роботов до 2030 года, а первые результаты новых мер поддержки будут видны уже в 2027 году.

В «Яндексе» сообщили, что независимо от федерального проекта компания уже ведет разработку софта для управления роботами и их конфигурирования. Базовые коробочные решения для узкоспециализированных роботов компания будет брать у вендоров, а уже затем создавать бесшовную платформу для полной роботизации, рассказал директор по развитию бизнеса «Яндекс роботикс» Георгий Клушин. Он также сообщил, что в этом году «Яндекс» планирует заключить контракты не менее чем с 10 партнёрами в сфере логистики. По данным источника «Ведомостей», аналогичное решение имеется и у «Сбера».

По мнению гендиректора «Дронсхаб групп» Максима Томских, нет необходимости делать абсолютно универсальный софт, но разрабатывать ПО верхнего уровня для работы с очень широким спектром роботов, создавать облачные платформы контроля, диспетчеризации и управления, разрабатывать системы ИИ, управляющие алгоритмы — это верный шаг. Благодаря этому можно будет объединить в единые системы широкий спектр роботов — автономные роверы, промышленные краны и автоматизацию, инфраструктуру, промышленных роботов и даже существующую технику, переведённую в беспилотный режим.

Руководитель разработки производственных систем «Аскон» Михаил Пономаренко отметил, что ранее для программирования роботов использовался иностранный софт, поскольку отечественные аналоги охватывали не весь спектр задач.

В свою очередь, директор по развитию ИИ и веб-технологий Artezio (входит в группу компаний «Ланит») Сергей Матусевич считает, что унифицированное ПО в экосистеме может ускорить внедрение роботизации, но само по себе не обеспечит необходимого темпа. Более реальной он назвал задачу установить 30 – 40 тыс. роботов к 2030 году, причём ключевые усилия надо направить на развитие кадров и инженерное образование.

Его поддержал Томских, отметивший, что проблема промышленной роботизации в России связана не с отсутствием должного ПО или недостатком государственной поддержки, а с массовым стремлением «купить в Китае подешевле». Основатель «Завода роботов» Андрей Гартунг тоже считает, что мер господдержки для производителей роботов достаточно, но заказчики и конечные потребители роботов не всегда понимают экономическую выгоду от этого. Поэтому в первую очередь нужно направлять усилия на информирование заказчиков, повышение уровня квалификации инженеров и развитие инженерного образования, подчеркнул он.

В США создали робота, вдохновлённого белкой — он может прыгать с ветки на ветку

Группа учёных из США опубликовала в журнале Science Robotics статью с описанием прыгающего робота. Он способен перепрыгивать с ветки на ветку и может использоваться в строительстве или лесном хозяйстве. Оснащение робота датчиками позволит проводить инспекцию сооружений и мониторинг окружающей среды, а также откроет множество новых способов применения для этой платформы, способной удерживать баланс в сложных условиях.

 Источник изображений: Justin K. Yim

Источник изображений: Justin K. Yim

«Нас вдохновили белки», — объяснила Джастина Йим (Justin Yim), которая трудится в Университете Иллинойса в Урбане-Шампейне. Белки умеют компенсировать недолёты и перелёты при приземлении, балансируя телом таким образом, чтобы удержаться на месте, куда перепрыгнули. Учёные попытались воспроизвести похожие механизмы в небольшой роботизированной платформе с одной ногой. Для большей надёжности они снабдили её захватом, чтобы робот-белка не упал с опоры даже в случае потери баланса.

Сообщается, что в 25 из 30 попыток перепрыгнуть с одной тонкой ПВХ-трубы на другую робот смог приземлиться на столь маленькую цель. В двух случаях он сделал это идеально, оставшись в вертикальном положении, тогда как в остальных переворачивался и зависал на захватах. Это открыло путь для очередной модификации робота, направленной на создание более крепких захватов, подобно цепким когтям белок. В конечном итоге робот сможет прыгать с одной опоры на другую и делать это с мастерством живой белки. Однако, как уточняют исследователи, до этого пройдёт ещё немало времени.

Google DeepMind дала роботам ИИ, с которым они могут выполнять сложные задания без предварительного обучения

Лаборатория Google DeepMind представила две новые модели ИИ, которые помогут роботам «выполнять более широкий спектр реальных задач, чем когда-либо прежде». Gemini Robotics — это модель «зрение-язык-действие», способная понимать новые ситуации без предварительного обучения. А Gemini Robotics-ER компания описывает как передовую модель, которая может «понимать наш сложный и динамичный мир» и управлять движениями робота.

 Источник изображений: Google DeepMind

Источник изображений: Google DeepMind

Модель Gemini Robotics построена на основе Gemini 2.0, последней версии флагманской модели ИИ от Google. ПО словам руководителя отдела робототехники Google DeepMind Каролины Парада (Carolina Parada), Gemini Robotics «использует мультимодальное понимание мира Gemini и переносит его в реальный мир, добавляя физические действия в качестве новой модальности».

Новая модель особенно сильна в трёх ключевых областях, которые, по словам Google DeepMind, необходимы для создания по-настоящему полезных роботов: универсальность, интерактивность и ловкость. Помимо способности обобщать новые сценарии, Gemini Robotics лучше взаимодействует с людьми и их окружением. Модель способна выполнять очень точные физические задачи, такие как складывание листа бумаги или открывание бутылки.

«Хотя в прошлом мы уже достигли прогресса в каждой из этих областей по отдельности, теперь мы приносим [резко] увеличивающуюся производительность во всех трёх областях с помощью одной модели, — заявила Парада. — Это позволяет нам создавать роботов, которые более способны, более отзывчивы и более устойчивы к изменениям в окружающей обстановке».

Модель Gemini Robotics-ER разработана специально для робототехников. С её помощью специалисты могут подключаться к существующим контроллерам низкого уровня, управляющим движениями робота. Как объяснила Парада на примере упаковки ланч-бокса — на столе лежат предметы, нужно определить, где что находится, как открыть ланч-бокс, как брать предметы и куда их класть. Именно такой цепочки рассуждений придерживается Gemini Robotics-ER.

Разработчики уделили серьёзное внимание безопасности. Исследователь Google DeepMind Викас Синдхвани (Vikas Sindhwani) рассказал, как лаборатория использует «многоуровневый подход», при котором модели Gemini Robotics-ER «обучаются оценивать, безопасно ли выполнять потенциальное действие в заданном сценарии».

Кроме того, Google DeepMind разработала ряд эталонных тестов и фреймворков, чтобы помочь дальнейшим исследованиям безопасности в отрасли ИИ. В частности, в прошлом году лаборатория представила «Конституцию робота» — набор правил, вдохновлённых «Тремя законами робототехники», сформулированными Айзеком Азимовым в рассказе «Хоровод» в 1942 году.

В настоящее время Google DeepMind совместно с компанией Apptronik разрабатывает «следующее поколение человекоподобных роботов». Также лаборатория предоставила доступ к своей модели Gemini Robotics-ER «доверенным тестировщикам», среди которых Agile Robots, Agility Robotics, Boston Dynamics и Enchanted Tools.

«Мы полностью сосредоточены на создании интеллекта, который сможет понимать физический мир и действовать в этом физическом мире, — сказала Парада. — Мы очень рады использовать это в нескольких воплощениях и во многих приложениях для нас».

Напомним, что в сентябре 2024 года исследователи из Google DeepMind продемонстрировали метод обучения, позволяющий научить робота выполнять некоторые требующие определённой ловкости действия, такие как завязывание шнурков, подвешивание рубашек и даже починка других роботов.

MIPS займётся разработкой собственных чипов и сосредоточится на робототехнике

Основанная ещё в середине восьмидесятых годов прошлого века компания MIPS до сих пор по аналогии с Arm предлагала лицензировать её процессорную архитектуру своим клиентам, но на этой неделе решила изменить свой вектор стратегического развития. Компания будет разрабатывать собственные процессоры и сосредоточится в сегменте робототехники.

 Источник изображения: MIPS

Источник изображения: MIPS

Об этом сообщило агентство Reuters со ссылкой на заявления генерального директора MIPS Самира Уоссона (Sameer Wasson). По его словам, сейчас наиболее перспективными сегментами на рынке компонентов для робототехники MIPS считает три направления деятельности: датчики, управляющая электроника верхнего уровня и компоненты для управления исполнительными механизмами роботов. По замыслу руководства MIPS, свои силы в новом для себя статусе компания начнёт пробовать на рынке автомобильной автоматики. К концу 2027 года она будет предлагать соответствующие чипы, а к 2028 году она развернёт их массовые поставки.

От лицензирования собственных разработок MIPS при этом не откажется, да и превращение в «кремниевую компанию за одну ночь» ей не грозит, как признаётся руководитель разработчика процессорных архитектур. Заметим, что архитектурные решения MIPS давно использует израильская Mobileye, которая снабжает своими системами активной помощи водителю миллионы автомобилей ежегодно и является дочерней структурой корпорации Intel. Успехи в наделении роботов технологиями искусственного интеллекта, по мнению руководства MIPS, заставляют компанию верить в перспективность избранной стратегии. Не факт, что собственные чипы MIPS займут существенную долю рынка, но в компании считают работоспособный процессор лучшим фактором привлечения клиентов, чем презентацию в PowerPoint.

Microsoft представила ИИ-агента Magma для управления приложениями и реальными роботами

Разработчики из Microsoft Research представили мультимодальную языковую ИИ-модель Magma, которая способна обрабатывать визуальные и текстовые данные для управления программными интерфейсами и роботизированными системами. Если алгоритм после тестирования выйдет за пределы Microsoft, то это может стать важным шагом на пути к созданию универсального мультимодального ИИ, способного работать как в цифровом, так и в реальном пространстве.

 Деомнтсрация того, как Magma управляет роботизированной рукой / Источник изображения: Microsoft Research

Демонстрация того, как Magma управляет роботизированной рукой / Источник изображения: Microsoft Research

Microsoft утверждает, что Magma является первой ИИ-моделью, которая способна не только обрабатывать мультимодальные данные (например, текст, изображения, видео), но и умеет выполнять действия на их основе, будь то навигация по пользовательскому интерфейсу или манипулирование физическими объектами. Разработка алгоритма Magma велась совместными усилиями разработчиков из Microsoft, KAIST, Университета Мэриленда, Висконсинского университета в Мэдисоне и Университета Вашингтона.

Ранее уже были реализованы проекты в сфере робототехники, основой которых становились большие языковые модели (LLM). К таким работам можно отнести проекты PALM-E и RT-2 от Google или ChatGPT for Robotics от Microsoft, где ИИ-системы были задействованы для управления программными интерфейсами.

 Комбинированный график, демонстрирующий возможности Magma / Источник изображения: Microsoft Research

Комбинированная схема, демонстрирующая возможности Magma / Источник изображения: Microsoft Research

В отличие от многих уже созданных мультимодальных алгоритмов, требующих использования отдельных моделей для восприятия и управления, в Magma эти способности объединены внутри единой базовой ИИ-модели. Microsoft позиционирует Magma, как существенный шаг на пути создания единого ИИ-агента, т.е. системы, способной автономно разрабатывать планы действий и выполнять многоэтапные задачи от имени человека, а не просто отвечать вопросы о том, что она видит.

«Учитывая описанную цель, Magma способна формулировать планы и выполнять действия для их достижения. Эффективно передавая знания, извлекаемые из свободно доступных визуальных и языковых данных, Magma объединяет вербальный, пространственный и временной алгоритмы для навигации по сложным задачам и обстановке», — говорится в сообщении исследователей из Microsoft.

 Источник изображения:  Microsoft Research

Источник изображения: Microsoft Research

ИИ-модель Magma включает в себя два технических компонента: Set-of-Mark (идентифицирует объекты, которыми можно манипулировать в среде, присваивая цифровые метки интерактивным элементам, таким как нажимаемые кнопки в пользовательском интерфейсе или захватываемые объекты в рабочем пространстве роботов) и Trace-of-Mark (позволяет алгоритму выполнять такие задачи, как навигация по пользовательским интерфейсам или управление роботизированными руками для захвата и перемещения объектов).

Один из участников проекта рассказал, что название алгоритма Magma расшифровывается как M(ultimodal) Ag(entic) M(odel) at Microsoft (Rese)A(rch). В описании алгоритма Microsoft утверждает, что Magma-8B демонстрирует конкурентоспособные результаты в бенчмарках, показывая высокие результаты в задачах навигации по пользовательскому интерфейсу и манипулировании роботами.

Так в бенчмарке VQAv2 алгоритм Magma получил 80,0 баллов за визуальные ответы на вопросы, что выше результата GPT-4V (77,2 балла), но ниже показателя LLaVA-Next (81,8 балла). Показатель алгоритма POPE в 87,4 балла в настоящее время является абсолютно лучшим среди ИИ-моделей, участвовавших в сравнении. Отмечается, что в сфере манипулирования роботами Magma превосходит OpenVLA.

 Источник изображения: Microsoft Research

Источник изображения: Microsoft Research

По заявлениям разработчиков, Magma отличается от аналогов вроде GPT-4V тем, что выходит за рамки так называемого «вербального интеллекта» и включает в себя «пространственный интеллект», т.е. возможность планирования и выполнения действий. Обучаясь на смеси изображений, видео, робототехнических данных и взаимодействий с пользовательским интерфейсом, Magma, по сути, является полноценным мультимодальным ИИ-агентом, а не просто перцептивной моделью.

Как и все ИИ-модели, Magma не совершенна. Документация Microsoft указывает на то, что алгоритм по-прежнему сталкивается с техническими ограничениями при принятии сложных пошаговых решений, требующих многократного выполнения действий в течение определённого времени. Microsoft продолжает работать над улучшением алгоритма. Софтверный гигант намерен выложить исходный код Magma и другую документацию на GitHub, чтобы сторонние исследователи могли использовать эти наработки для реализации собственных проектов.

Meta✴ сформировала команду для разработки роботов-гуманоидов и направит на это значительные инвестиции

Meta✴ объявила сотрудникам в пятницу о создании новой команды, которая будет заниматься разработкой человекоподобных роботов, способных действовать как люди и помогать потребителям в выполнении различных задач. Ранее о планах компании развивать это направление и выделять в разработку значительные инвестиции сообщил Bloomberg.

 Источник изображения: Gabriele Malaspina/unsplash.com

Источник изображения: Gabriele Malaspina/unsplash.com

Возглавит новую команду Марк Уиттен (Marc Whitten), который в начале этого месяца покинул пост гендиректора подразделения беспилотных автомобилей Cruise компании General Motors, а до этого занимал руководящие должности в Unity Software и Amazon.com.

В Meta✴ считают, что хотя робототехнические компании достигли определённого прогресса в области аппаратной части для роботов-гуманоидов, достижения Meta✴ в сфере ИИ и обработки данных, собранных с устройств дополненной и виртуальной реальности, могут ускорить прогресс в зарождающейся отрасли. Как полагают в Meta✴, нынешние роботы-гуманоиды всё ещё недостаточно функциональны, чтобы выполнять простейшие домашние дела, например, сложить одежду, принести стакан воды, поставить посуду на полку для мытья — всё, что могло бы заинтересовать потребителей в этой категории.

Эндрю Босворт (Andrew Bosworth), главный технический директор Meta✴, отметил в служебной записке, что технологии, созданные Reality Labs и специалистами компании по ИИ, дополняют имеющиеся достижения, необходимые для робототехники. «Мы считаем, что расширение нашего портфеля для инвестиций в эту область только увеличит ценность Meta✴ AI и наших программ смешанной и дополненной реальности», — добавил он.

Уиттен будет подчиняться непосредственно Босворту. По словам источника, его команда будет включать порядка 100 специалистов. Как сообщил один из участников проекта, программное обеспечение, датчики и вычислительные пакеты, которые Meta✴ уже разрабатывает для своих устройств, также могут использоваться в роботах-гуманоидах. В этом году Meta✴ планирует потратить $65 млрд на сопутствующие продукты, включая инфраструктуру ИИ и новое робототехническое направление.

Цель Meta✴ — сделать то, что ОС Android от Google и чипы Qualcomm сделали для телефонной индустрии, заложив основу для развития остального рынка. По словам одного из источников, компания позиционирует свой проект как платформу для разработки роботов и рассчитывает сделать ИИ-модели Llama основой для создателей робототехники по всему миру. Meta✴ также займётся разработкой инструментов для обеспечения безопасности использования роботов.

В Meta✴ считают, что пройдёт ещё пара лет до того момента, как роботы-гуманоиды появятся в широком доступе, и могут пройти годы, прежде чем платформа компании обеспечит поддержку сторонних продуктов. Но это станет основным направлением для Meta✴ и технологической отрасли, утверждает источник Bloomberg.

Apple запустит серийное производство роботов, но нескоро

На прошлой неделе компания Apple неожиданно поделилась исследовательской документацией и видеороликом, на котором демонстрировала созданную своими специалистами роботизированную настольную лампу. По мнению известного аналитика Мин-Чи Куо (Ming-Chi Kuo), серийное производство роботов Apple сможет начать не ранее 2028 года.

 Источник изображения: Apple

Источник изображения: Apple

К такому выводу эксперт приходит после появления видеоролика, демонстрирующего наличие у Apple прототипа будущего робототехнического изделия. По его словам, типовая продолжительность соответствующих стадий подготовки к выпуску нового продукта позволяет предположить, что первые роботы Apple в серийном исполнении появятся не ранее 2028 года. При этом необычно, что компания открыто делится информацией о прототипах уже сейчас. Скорее всего, она тем самым надеется привлечь необходимые для работы над роботами ценные кадры.

Как считает Куо, Apple экспериментирует как с человекоподобными, так и с роботами прочих формфакторов, которые смогут пригодиться в экосистеме умного дома в будущем. Как отмечалось ранее, в перспективе нескольких лет Apple надеется выпустить некий гибрид роботизированной умной колонки и планшета, который может поворачиваться автоматически в нужную сторону и следовать за пользователем самостоятельно.

Как у Pixar: Apple показала харизматичного робота-лампу — он может рассказать о погоде, посмотрев в окно

Подразделение робототехники компании Apple создало прототип робота, напоминающего лампу из мультфильма «Люксо-младший», о чём сообщается на веб-сайте Apple Machine Learning Research. Разработчики продемонстрировали в видеоролике две версии робота: одна из них отличается выразительными реакциями на команды человека и выглядит гораздо интереснее второй, которая просто выполняет команды.

 Источник изображения: Apple

Источник изображения: Apple

Оба робота похожи на настольную лампу с шарнирной опорой, оснащённую камерой, динамиком и проектором. Они реагируют на жесты и голосовые команды, а также обладают голосом, похожим на Siri от Apple. При этом версия робота под названием Expressive (выразительный) демонстрирует большую индивидуальность.

Робот-лампа Expressive взаимодействует с человеком в реалистичной манере. Например, когда пользователь спрашивает о погоде, робот сначала смотрит в окно, прежде чем сообщить прогноз. Чтобы напомнить о необходимости выпить воды, он подталкивает кружку. Если человек говорит, что собирается в поход, но не сможет взять робота с собой, тот опускает «голову» в притворной грусти. Когда человек собирает 3D-принтер, робот проецирует соответствующее обучающее видео на стену. Он также реагирует на жесты руки, перемещаясь для обеспечения нужного освещения при фотосъёмке на iPhone. Кроме того, в видео демонстрируется, как робот включает музыку и танцует, поднимая настроение собеседнику.

Второй робот, получивший название Functional (функциональный), просто выполняет команды и остаётся неподвижным в их отсутствие.

Как отметили исследователи, такие реалистичные, управляемые выражением движения «значительно повышают вовлечённость пользователя» по сравнению с традиционными «управляемыми функциями» движениями.

В прошлом году журналист Bloomberg Марк Гурман (Mark Gurman) сообщил, что Apple разрабатывает настольного робота с «дисплеем, похожим на iPad», прикреплённым к «роботизированной конечности». Управлять устройством можно будет с помощью Siri и Apple Intelligence, а также различать голоса пользователей. По словам Гурмана, Apple планирует представить новинку в 2026 или 2027 году.


window-new
Soft
Hard
Тренды 🔥
Белый дом работает с Anthropic над созданием правил безопасного применения ИИ-моделей 2 ч.
В российском Epic Games Store стартовала раздача Citizen Sleeper — текстовой RPG на обломках межпланетного капитализма 8 ч.
Duke Nukem 3D, Blood, Shadow Warrior и не только: российский разработчик портировал в браузер классические шутеры на движке Build Engine 11 ч.
Epic Games пообещала, что ИИ в Unreal Engine 6 «изменит создание игр» и «сократит рутину» у разработчиков 12 ч.
Adobe добавила в Photoshop и Premiere ИИ-помощников 12 ч.
Журналисты нашли подтверждения, что новой студии создателя Yakuza больше не существует 13 ч.
В ОАЭ запретили соцсети для детей до 15 лет и ввели проверку возраста 14 ч.
«Крёстный отец ИИ» назвал xAI провалом и пригрозил взрывом «пузыря ИИ» 14 ч.
Новый вариант CAPTCHA от Google требует от пользователей махать руками перед компьютером 16 ч.
Создатель Deus Ex рассказал, что произошло с многострадальной System Shock 3 17 ч.
Исполнительным вице-президентом Intel Foundry назначен бывший глава SK hynix 2 ч.
Акции SanDisk и Micron резко выросли после того, как Apple пообещала поднять цены 7 ч.
Новая статья: Обзор игрового ноутбука MAIBENBEN Typhoon X16C: рабочий класс, версия 2026 7 ч.
Lenovo выпустила доступный игровой QHD-монитор с частотой обновления 275 Гц за $130 7 ч.
Муравейник Шрёдингера: физики нашли квантовую запутанность в сантиметровом кристалле странного металла 7 ч.
Акции Intel выросли на 10 % на фоне публикации Трампа о сделке по производству чипов для Apple 7 ч.
ViewSonic выпустила 23,8-дюймовый 4K-монитор IPS с частотой 160 Гц для геймеров 10 ч.
Amazon решила конкурировать с Nvidia: компания намерена начать продажи собственных ИИ-ускорителей Trainium 11 ч.
В США начали строить лишь половину ЦОД, которые должны заработать в 2026 году 13 ч.
Первые устройства с поддержкой HDMI 2.2 выйдут в следующем году 13 ч.