Сегодня 20 ноября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → rdr2

GPT-4 освоил Red Dead Redemption 2, но его подводит машинное зрение

Группа исследователей из Китая и Сингапура научила ИИ на базе OpenAI GPT-4V играть в Red Dead Redemption 2 (RDR2). В своей статье они рассказали о концепции общего компьютерного контроля (General Computer Control, GCC) для ИИ, и о мультимодальном агенте CRADLE — интерфейсе между GPT-4V и RDR2. По их мнению, основные проблемы у игрового ИИ-агента возникли при использовании машинного зрения.

 Источник изображения: Rockstar

Источник изображения: Rockstar

Исследователи поставили своей целью заставить ИИ, работающий на базе OpenAI GPT-4V, взаимодействовать с компьютером, воспринимая визуальные и звуковые сигналы, как это делает среднестатистический человек-пользователь ПК. Проект даёт представление о том, насколько далеко продвинулись разработчики ИИ в движении в сторону создания общего (сильного) искусственного интеллекта (AGI).

Исследователи выбрали RDR2, так как она имеет «сложную систему управления черным ящиком, которая воплощает в себе самые требовательные компьютерные задачи и позволяет нам оценить границы производительности нашей платформы в таких виртуальных средах». Кроме того, такие элементы пользовательского интерфейса, как диалоги, уникальные значки, внутриигровые подсказки и инструкции, гарантируют, что никакие базовые знания не воспринимаются как нечто само собой разумеющееся, что отлично подходит для обучения ИИ. Исследователи утверждают, что управление игрой с помощью мыши и клавиатуры обеспечивает лучшую тренировку для GCC.

 Как устроен CRADLE / Источник изображения: arxiv.org

Как устроен CRADLE / Источник изображения: arxiv.org

Исследователи стремились продемонстрировать способность ИИ изучать игру с нуля (без доступа к какому-либо внутреннему состоянию игры или API), то есть как это делает человек. ИИ-агент «проходил» игру, перемещаясь по миру и выполняя задания, следуя основной сюжетной линии RDR2. В целом, CRADLE добился заметного успеха в RDR2. Он смог «последовательно выполнять все задачи основной сюжетной линии», за исключением миссии с ураганной перестрелкой, заданий, которые требуют исследования сложного внутреннего мира, и многоэтапных миссий с открытым финалом.

 Как CRADLE выполняет buhjdst задания / Источник изображения: arxiv.org

Как CRADLE выполняет игровые задания / Источник изображения: arxiv.org

Исследователи считают, что причиной некоторых повторяющихся трудностей, с которыми сталкивался CRADLE, является GPT4-V. По их мнению, «возможности пространственно-визуального распознавания GPT-4V недостаточны для точного детального контроля». GPT4-V не справился с концепциями, специфичными для предметной области, такими как уникальные значки в игре, с пониманием мини-карт, а также с общими препятствиями в игровой среде.

 Производительность CRADLE в разных типах миссий / Источник изображения: arxiv.org

Производительность CRADLE в разных типах миссий / Источник изображения: arxiv.org

Хотя опубликованная статья посвящена взаимодействию ИИ с RDR2, авторы утверждают, что предназначение системы CRADLE в рамках GCC гораздо шире: «для поддержки более широкого спектра игр, таких как игры-симуляторы и стратегии, а также различных программных приложений».


window-new
Soft
Hard
Тренды 🔥
Думающая ИИ-модель OpenAI о1 получила 83 балла на математической олимпиаде США 14 мин.
Инсайдер: EA организовала для Battlefield 6 крупнейшее тестирование в истории серии, чтобы избежать провалов Battlefield 5 и Battlefield 2042 21 мин.
Власти США собрались повторить Манхэттенский проект, но теперь для создания ИИ уровня человека 42 мин.
Российские банки запустят универсальный заменитель Apple Pay на базе Bluetooth во второй половине 2025 года 2 ч.
«Не хочу, чтобы это заканчивалось»: Netflix показала трейлер взрывного финала второго сезона «Аркейн» 2 ч.
Google научила Gemini запоминать личную информацию о пользователе — для его же удобства 11 ч.
Первый полноценный трейлер фильма «Minecraft в кино» приятно удивил фанатов 12 ч.
Поговорить с ChatGPT теперь можно в веб-версии сервиса — там появился голосовой интерфейс Advanced Voice Mode 13 ч.
Android 16 стала доступна первым тестировщикам и разработчикам 13 ч.
Black Myth: Wukong стала самым низкооценённым претендентом на «Игру года» в истории The Game Awards 14 ч.
ЕС планирует привлечь технологии из Китая в обмен на субсидии 12 мин.
Dell представила серверы PowerEdge XE9685L и XE7740 для ИИ-инфраструктуры 26 мин.
SpaceX запустила в космос банан и мягко спустила его в океан — первые итоги шестого полёта Starship 51 мин.
Meta планирует сделать AR-очки Orion таким же популярным гаджетом, как наушники AirPods 2 ч.
Nebius, бывшая Yandex, развернёт в США своей первый ИИ-кластер на базе NVIDIA H200 2 ч.
Microsoft представила инстансы Azure HBv5 с уникальными чипами AMD EPYC 9V64H и памятью HBM3 2 ч.
Asustor представила Flashstor Gen2 — NAS на 6 или 12 твердотельных накопителей M.2 2 ч.
Консоль PlayStation Portal получила поддержку потоковой трансляции игр из облака 3 ч.
Entergy предложила построить газовую электростанцию на 1,5 ГВт, чтобы напрямую запитать крупный ЦОД 3 ч.
«Познакомьтесь с моим новым другом»: Ким Кардашьян протестировала робота Tesla Optimus и беспилотное такси Cybercab 6 ч.