Сегодня 21 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Waymo и Gemini научат роботакси справляться со сложными дорожными ситуациями

Waymo, дочерняя компания Alphabet, представила новый подход к обучению своих беспилотных транспортных средств, используя модель Gemini — большую мультимодальную языковую модель (MLLM) от Google. Модель улучшит навигацию автономных автомобилей и позволит лучше справляться со сложными дорожными ситуациями.

 Источник изображения: waymo.com

Источник изображения: waymo.com

В новом исследовательском докладе Waymo дала определение своей разработке как «сквозной мультимодальной модели для автономного вождения» (EMMA), которая обрабатывает данные с сенсоров и помогает роботакси принимать решения о направлении движения, избегая препятствий. Как пишет The Verge, Waymo давно подчёркивала своё стратегическое преимущество благодаря доступу к научным исследованиям в области искусственного интеллекта (ИИ) Google DeepMind, ранее принадлежавшей британской компании DeepMind Technologies.

Новая система EMMA представляет собой принципиально иной подход к обучению автономных транспортных средств. Вместо традиционных модульных систем, которые разделяют функции на восприятие, планирование маршрута и другие задачи, EMMA предлагает единый подход, который позволит обрабатывать данные комплексно, поможет избежать ошибок, возникающих при передаче данных между модулями, и улучшит адаптацию к новым, незнакомым условиям на дороге в реальном масштабе времени.

Одним из ключевых преимуществ использования моделей MLLM, в частности Gemini, является их способность к обобщению знаний, почерпнутых из огромных объёмов данных, полученных из интернета. Это позволяет моделям лучше адаптироваться к нестандартным ситуациям на дороге, таким как неожиданное появление животных или ремонтные работы. Кроме того, модели, обученные на основе Gemini, способны к «цепочке рассуждений». Это метод, который помогает разбивать сложные задачи на последовательные логические шаги, улучшая процесс принятия решений.

Несмотря на успехи, Waymo признает, что EMMA имеет свои ограничения. Например, модель пока не поддерживает обработку 3D-данных с таких сенсоров, как лидар или радар, из-за высокой вычислительной сложности. Кроме того, EMMA способна обрабатывать лишь ограниченное количество кадров изображений одновременно. Подчёркивается, что потребуется дальнейшее исследование для преодоления всех этих ограничений перед полноценным внедрением модели в реальных условиях.

Waymo также осознает и риски, связанные с использованием MLLM в управлении автономными транспортными средствами. Модели, подобные Gemini, могут допускать ошибки или «галлюцинировать» в простых задачах, что конечно недопустимо на дороге. Тем не менее, есть надежда, что дальнейшие исследования и улучшения архитектуры ИИ-моделей для автономного вождения преодолеют эти проблемы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Угрозы, вымогательство и доносы в Следственный комитет: разработчики российского хоррора «Зайчик» подверглись травле со стороны бывших партнёров 7 мин.
Московский суд оштрафовал Telegram и YouTube на 80 000 рублей за неудаление персональных данных 54 мин.
Облачная ИИ-платформа Together AI получила на развитие более $300 млн при оценке в $3,3 млрд 2 ч.
Объём рынка средств для защиты данных в России в 2024 году достиг 23 млрд руб. 2 ч.
Приложения для слежки допустили слив личных данных миллионов людей по всему миру 4 ч.
На Sony опять подали в суд из-за слишком высоких цен в PS Store — теперь в Нидерландах 11 ч.
Роскомнадзор разблокировал агрегатор криптообменников BestChange 12 ч.
Инсайдер из Microsoft намекнул на релиз GPT-4.5 на следующей неделе и GPT-5 в мае 12 ч.
Epic Games Store устроил раздачу кооперативного зомби-шутера World War Z: Aftermath, в том числе и для российских игроков 13 ч.
Российская облачная среда для разработки GigaIDE Cloud с ИИ-ассистентом вышла в релиз 14 ч.
Выяснилось, что первый фирменный 5G-модем Apple C1 выпускает TSMC сразу по двух техпроцессам 5 мин.
iPhone 17 будут дороже предшественников — Apple начала готовить пользователей к повышению цен 11 мин.
Нужно больше дата-центров: AWS намерена построить по ЦОД в «каждом округе» между Северной Вирджинией и Ричмондом 20 мин.
Полумеры и уловки: как производители ноутбуков саботируют право на ремонт 2 ч.
QNAP представила 10GbE-коммутатор начального уровня QSW-3205-5T 2 ч.
Стартап Figure продемонстрировал, как его человекоподобные роботы справляются с бытовыми делами 3 ч.
Mercedes-Benz уже тестирует электромобиль с твердотельными батареями и запасом хода 1000 км 4 ч.
Бурный рост китайского автопрома обернулся тысячами деградирующих электромобилей 5 ч.
Новая статья: Обзор мини-ПК OSiO BaseLine B51i-017: купил, включил, работает! 11 ч.
Учёные обнаружили, что 30 лет неправильно рассуждали о расширении Вселенной и тёмной энергии 11 ч.