Сегодня 15 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Waymo и Gemini научат роботакси справляться со сложными дорожными ситуациями

Waymo, дочерняя компания Alphabet, представила новый подход к обучению своих беспилотных транспортных средств, используя модель Gemini — большую мультимодальную языковую модель (MLLM) от Google. Модель улучшит навигацию автономных автомобилей и позволит лучше справляться со сложными дорожными ситуациями.

 Источник изображения: waymo.com

Источник изображения: waymo.com

В новом исследовательском докладе Waymo дала определение своей разработке как «сквозной мультимодальной модели для автономного вождения» (EMMA), которая обрабатывает данные с сенсоров и помогает роботакси принимать решения о направлении движения, избегая препятствий. Как пишет The Verge, Waymo давно подчёркивала своё стратегическое преимущество благодаря доступу к научным исследованиям в области искусственного интеллекта (ИИ) Google DeepMind, ранее принадлежавшей британской компании DeepMind Technologies.

Новая система EMMA представляет собой принципиально иной подход к обучению автономных транспортных средств. Вместо традиционных модульных систем, которые разделяют функции на восприятие, планирование маршрута и другие задачи, EMMA предлагает единый подход, который позволит обрабатывать данные комплексно, поможет избежать ошибок, возникающих при передаче данных между модулями, и улучшит адаптацию к новым, незнакомым условиям на дороге в реальном масштабе времени.

Одним из ключевых преимуществ использования моделей MLLM, в частности Gemini, является их способность к обобщению знаний, почерпнутых из огромных объёмов данных, полученных из интернета. Это позволяет моделям лучше адаптироваться к нестандартным ситуациям на дороге, таким как неожиданное появление животных или ремонтные работы. Кроме того, модели, обученные на основе Gemini, способны к «цепочке рассуждений». Это метод, который помогает разбивать сложные задачи на последовательные логические шаги, улучшая процесс принятия решений.

Несмотря на успехи, Waymo признает, что EMMA имеет свои ограничения. Например, модель пока не поддерживает обработку 3D-данных с таких сенсоров, как лидар или радар, из-за высокой вычислительной сложности. Кроме того, EMMA способна обрабатывать лишь ограниченное количество кадров изображений одновременно. Подчёркивается, что потребуется дальнейшее исследование для преодоления всех этих ограничений перед полноценным внедрением модели в реальных условиях.

Waymo также осознает и риски, связанные с использованием MLLM в управлении автономными транспортными средствами. Модели, подобные Gemini, могут допускать ошибки или «галлюцинировать» в простых задачах, что конечно недопустимо на дороге. Тем не менее, есть надежда, что дальнейшие исследования и улучшения архитектуры ИИ-моделей для автономного вождения преодолеют эти проблемы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Спринт, торговля и продолжение сюжета: разработчики Subnautica 2 раскрыли план улучшения игры на ближайшие месяцы 14 мин.
ChatGPT получит прямой доступ к банковским счетам пользователей — для анализа расходов и финансовых советов 31 мин.
Трамп и Си Цзиньпин обсудили ограничения слишком умного ИИ и зависшие поставки Nvidia H200 55 мин.
Microsoft намерена избавить Windows 11 от главной причины «синих экранов» 2 ч.
Доминирование ChatGPT пошатнулось — Gemini и Perplexity быстро набирают обороты 2 ч.
Pragmata стала новой жертвой пиратов — игру взломали без гипервизора 2 ч.
YouTube Shorts набрали популярность на смарт-телевизорах — 2 млрд часов просмотра за месяц 3 ч.
На смарт-очках Meta Ray-Ban Display появятся сторонние приложения 3 ч.
Крипторынок испугался ИИ-хакеров: под ударом оказался сектор DeFi с оборотом $130 млрд 3 ч.
Ненасытный ИИ может снова отправить OpenAI на поиски денег — даже рекордных $122 млрд инвестиций мало 5 ч.
Alibaba Cloud потребуется в 10 раз больше вычислительных мощностей, чем в 2022 году, а Tencent научилась обходиться малым 23 мин.
В ближайший годы четыре из пяти премиум-смартфонов нашпигуют ИИ 2 ч.
Учёные создали робота-медузу без батареи — он плавает быстрее всех аналогов и сможет лечить людей изнутри 2 ч.
Уж лучше АЭС за домом, чем ЦОД: американцам разонравились дата-центры 2 ч.
Доля контрафактных комплектующих для зарубежного инфраструктурного оборудования в России приблизилась к 20 % 3 ч.
MSI представила игровой монитор MAG OLED 271QPX32 — QD-OLED Penta Tandem, 1440p и 320 Гц 4 ч.
Представлен флагманский игровой ноутбук Asus ROG Strix SCAR 18 с потреблением до 320 Вт 5 ч.
Asus выпустила свою первую оперативную память — и сразу за $880 6 ч.
Немецкие учёные добились рекордного КПД при превращении солнечного света в водород 6 ч.
Asus представила трёхлитровый игровой ПК ROG NUC 16 — он меньше PS5, но в 7,5 раз дороже 6 ч.