Новости Software

«Яндекс» опубликовал крупнейший массив данных для обучения беспилотных автомобилей

«Яндекс» опубликовал набор данных для беспилотных автомобилей, предназначенный для исследований в области машинного обучения и автономного транспорта, который является самым большим в мире открытым всем желающим массивом подобных данных. В нём содержатся данные о более 1600 часов движения, включая 600 тыс. размеченных фрагментов поездок на дорогах России, Израиля и США при различных метеоусловиях — в хорошую погоду, в снег и в дождь.

 habr.com

habr.com

Данные были опубликованы для конкурса Shifts Challenge, который «Яндекс» проведёт в рамках международной конференции NeurIPS 2021 совместно с учёными из Оксфорда и Кембриджа. Главной целью конкурса является привлечь внимание к проблеме «сдвига данных» в машинном обучении.

«Если вы привыкли водить машину в небольшом городе, то в Москве вы не сразу адаптируетесь к трафику и, скорее всего, поначалу будете более осторожны на дороге. Это и есть сдвиг данных. Вы можете оценить его масштаб и скорректировать свои действия. Машинно обученные модели должны уметь делать то же самое — оценивать величину сдвига и эффективно действовать в новых условиях. От того, насколько хорошо алгоритм может работать при сдвиге данных, будет зависеть широта его применения», — рассказал старший исследователь Yandex Research Андрей Малинин.

Сдвиг данных встречается в случае, когда модели машинного обучения сталкиваются с незнакомыми ситуациями и неизвестными данными, то есть — с неопределённостью. Для будущего конкурса «Яндекс» выбрал три области: предсказание траектории движения транспорта и пешеходов на дороге, прогнозирование погоды и машинный перевод текстов.

Чтобы победить, участникам конкурса будет необходимо создать устойчивые к сдвигу модели. То есть модель машинного перевода, прошедшая обучение на художественной литературе, должна будет также качественно переводить и твиты, и ролики на YouTube.

Конкурс также обеспечит учёным доступ к уникальным данным, позволяющим оценить качество работы моделей машинного обучения в реальных условиях. Исследователи «Яндекса» вместе с командами Яндекс.Погоды, Яндекс.Переводчика и беспилотных технологий предоставили для участников конкурса данные сервисов, решающих практические задачи и часто сталкивающихся со сдвигом. Столь разнородные данные помогут ускорить разработку алгоритмов, которые будут гораздо быстрее адаптироваться к новым условиям.

Все представленные в наборе данные обезличены. Датасет по беспилотным автомобилям содержит высокоточные карты маршрутов и треки всех окружающих машин и пешеходов (их положение, скорость, ускорение и пр.), но не имеет видео, где можно распознать номера машин или лица прохожих.

Используя эти данные, исследователи должны будут обучить алгоритмы, после чего проверить качество их работы в условиях сдвига. Для создателей лучших алгоритмов организаторы конкурса приготовили денежные призы. Более подробно о конкурсе можно узнать в блоге компании на Хабре.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Sony подтвердила июльскую линейку игр для подписчиков PlayStation Plus 3 мин.
Юбилейный ретросборник Atari отправит геймеров в интерактивное путешествие через полвека игровой индустрии 22 мин.
Инсайдер раскрыл точные даты выхода FIFA 23 и новой Need for Speed 2 ч.
Тайваньский центробанк: на запуск национальной цифровой валюты уйдёт ещё несколько лет и её придётся рекламировать 2 ч.
Объём мирового рынка публичных облаков в 2021 году превысил $400 млрд 2 ч.
Новые карты, расширенная интерактивность и улучшения интерфейса: тактический шутер Ready or Not получил крупнейшее обновление 2 ч.
Симулятор выживания This War of Mine вошёл в школьную программу Польши и теперь доступен для бесплатного скачивания 4 ч.
В США и Бразилии заблокировали 272 веб-сайта с нелегальной музыкой 4 ч.
Видео: релизный трейлер дополнения Worldslayer к научно-фантастическому шутеру Outriders 5 ч.
VMware представила обновления базовых решений для виртуализации — vSphere+ и vSAN+ 5 ч.
HPE GreenLake позволит развернуть полноценное частное облако 2 мин.
В России разработают экраноплан XXI века 2 ч.
MSI выпустила плату Pro H610M 12VO, выполненную по стандарту питания ATX12VO 2 ч.
Volkswagen: полностью отказаться от ДВС не составит труда, а вот выпускать достаточно аккумуляторов для электромобилей будет сложнее 3 ч.
Китайские облака замедляют закупки серверов — их примеру могут последовать гиперскейлеры США 3 ч.
Некоторые Steam Deck получат более медленные SSD — Valve уверила, что на производительность в играх это не влияет 3 ч.
Samsung представила Galaxy XCover6 Pro — свой первый защищённый смартфон с 5G 3 ч.
Philips представила широкоформатный изогнутый 34-дюймовый монитор со встроенной веб-камерой 3 ч.
Бразилия тоже задумалась о принятии USB Type-C в качестве стандарта для зарядки гаджетов 4 ч.
Thermaltake выпустила блоки питания Toughpower PF1 TT Premium Edition мощностью до 1200 Вт 4 ч.