Сегодня 29 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Waymo и Gemini научат роботакси справляться со сложными дорожными ситуациями

Waymo, дочерняя компания Alphabet, представила новый подход к обучению своих беспилотных транспортных средств, используя модель Gemini — большую мультимодальную языковую модель (MLLM) от Google. Модель улучшит навигацию автономных автомобилей и позволит лучше справляться со сложными дорожными ситуациями.

 Источник изображения: waymo.com

Источник изображения: waymo.com

В новом исследовательском докладе Waymo дала определение своей разработке как «сквозной мультимодальной модели для автономного вождения» (EMMA), которая обрабатывает данные с сенсоров и помогает роботакси принимать решения о направлении движения, избегая препятствий. Как пишет The Verge, Waymo давно подчёркивала своё стратегическое преимущество благодаря доступу к научным исследованиям в области искусственного интеллекта (ИИ) Google DeepMind, ранее принадлежавшей британской компании DeepMind Technologies.

Новая система EMMA представляет собой принципиально иной подход к обучению автономных транспортных средств. Вместо традиционных модульных систем, которые разделяют функции на восприятие, планирование маршрута и другие задачи, EMMA предлагает единый подход, который позволит обрабатывать данные комплексно, поможет избежать ошибок, возникающих при передаче данных между модулями, и улучшит адаптацию к новым, незнакомым условиям на дороге в реальном масштабе времени.

Одним из ключевых преимуществ использования моделей MLLM, в частности Gemini, является их способность к обобщению знаний, почерпнутых из огромных объёмов данных, полученных из интернета. Это позволяет моделям лучше адаптироваться к нестандартным ситуациям на дороге, таким как неожиданное появление животных или ремонтные работы. Кроме того, модели, обученные на основе Gemini, способны к «цепочке рассуждений». Это метод, который помогает разбивать сложные задачи на последовательные логические шаги, улучшая процесс принятия решений.

Несмотря на успехи, Waymo признает, что EMMA имеет свои ограничения. Например, модель пока не поддерживает обработку 3D-данных с таких сенсоров, как лидар или радар, из-за высокой вычислительной сложности. Кроме того, EMMA способна обрабатывать лишь ограниченное количество кадров изображений одновременно. Подчёркивается, что потребуется дальнейшее исследование для преодоления всех этих ограничений перед полноценным внедрением модели в реальных условиях.

Waymo также осознает и риски, связанные с использованием MLLM в управлении автономными транспортными средствами. Модели, подобные Gemini, могут допускать ошибки или «галлюцинировать» в простых задачах, что конечно недопустимо на дороге. Тем не менее, есть надежда, что дальнейшие исследования и улучшения архитектуры ИИ-моделей для автономного вождения преодолеют эти проблемы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Meta обвинили в пиратстве порнофильмов для обучения ИИ 2 ч.
«Джуманджи» встречает «Восставшего из ада»: кооперативный хоррор Invokyr заставит сыграть в проклятую настольную игру 2 ч.
Microsoft нашла уязвимость в macOS, позволявшую обойти защиту TCC и украсть данные пользователя 2 ч.
В Google Chrome появятся ИИ-сводки о репутации магазинов 3 ч.
Sony подала в суд на Tencent из-за боевика Light of Motiram, который подозрительно похож на Horizon Zero Dawn 12 ч.
Microsoft превратила Edge в ИИ-браузер, начав тестирование режима Copilot Mode — пока бесплатно 13 ч.
«Лихо одноглазое» пробудилось в Steam и VK Play — это мрачный фольклорный хоррор от создателей «Чёрной книги» 13 ч.
Microsoft напомнила, что прекратит поддержку Windows 11 22H2 в октябре 15 ч.
Microsoft признала, что обновления замедлили Windows 11 24H2 и привели к сбоям и зависаниям 15 ч.
Это шанс для VR: Tencent выпустила открытую ИИ-модель Hunyuan 3D World Model 1.0, которая генерирует интерактивные 3D-миры 17 ч.
AAEON выпустила PICO-MTU4-SEMI — самый компактный в мире компьютер с процессором Intel Core Ultra 13 мин.
NVIDIA заказала у TSMC производство 300 000 ИИ-ускорителей H20 в ответ на высокий спрос в Китае 15 мин.
Insta360 поборется с DJI за рынок компактных дронов — квадрокоптер Antigravity получит 360-градусный обзор 2 ч.
Индия впервые запустит пилотируемый корабль на орбиту до конца года — за штурвалом будет «космический друг» 2 ч.
Птичка пропела картинку: блогер превратил скворца в передатчик изображений со скоростью до 2 Мбайт/с 2 ч.
Nvidia разместила заказ на выпуск 300 000 ускорителей H20 после снятия запрета на их поставку в Китай 4 ч.
Cadence придётся выплатить $140 млн штрафа за нарушение американских санкций в отношении Китая 5 ч.
Тарифные риски увеличили поставки в США смартфонов индийской сборки на 240 % 7 ч.
Новая статья: Обзор смартфона Nothing Phone (3): неординарный флагман с двумя экранами 12 ч.
Sony показала FlexStrike — аркадный геймпад для хардкорных фанатов файтингов 12 ч.