Сегодня 30 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → street fighter iii

Языковые модели ИИ сразились друг с другом в импровизированном турнире по Street Fighter III

На хакатоне Mistral AI, прошедшем в Сан-Франциско на минувшей неделе, разработчики Стэн Жирар (Stan Girard) и Quivr Brain представили тест LLM Colosseum с открытым исходным кодом, основанный на классическом аркадном файтинге Street Fighter III. Тест предназначен для определения самой эффективной языковой модели ИИ в не совсем традиционной, но зрелищной манере.

 Источник изображений: YouTube / Matthew Berman

Источник изображений: YouTube / Matthew Berman

ИИ-энтузиаст Мэтью Берман (Matthew Berman) решил провести с помощь теста LLM Colosseum своеобразный турнир между языковыми моделями, о чём он поделился в своём видео. В нём же Берман показал один из поединков между ИИ. Кроме того, он рассказал, как можно установить этот проект с исходным кодом на домашний ПК или Mac и оценить его самостоятельно.

Это не совсем типичный тест LLM. Как правило, маленькие языковые модели имеют преимущество в задержке и скорости, что приводит к победе в большинстве виртуальных боёв. В файтингах очень важна скорость реакции игроков на ответные действия своих оппонентов. То же правило работает и в случае противостояния ИИ против ИИ.

 Источник изображений: OpenGenerativeAI team

Источник изображений: OpenGenerativeAI team

Языковая модель в реальном времени принимает решение, как ей сражаться. Поскольку LLM представляют собой текстовые модели, их обучили в игре Street Fighter III с помощью текстовых подсказок. ИИ сначала дали проанализировать контекст игры в целом, а затем подсказали, как реагировать на то или иное игровое действие в той или иной ситуации, не забыв про вариативность ходов. ИИ обучили приближаться или отдаляться от противника, а также использовать различные приёмы вроде огненного шара, мегаудара, урагана и мегаогненного шара.

 Источник изображения: OpenGenerativeAI team

Источник изображения: OpenGenerativeAI team

Продемонстрированный на видео бой между ИИ выглядит динамично. Оппоненты действуют стратегически, блокируют удары противника и используют специальные приёмы. Однако к настоящему моменту проект LLM Colosseum позволяет использовать только одного игрового персонажа, Кена.

Согласно тестам Жирара, лучшей языковой моделью в турнире Street Fighter III оказалась GPT 3.5 Turbo от OpenAI. Среди восьми участников она достигла самого высокого рейтинга ELO — 1776.

В отдельной серии тестов, организованных Банджо Обайоми (Banjo Obayomi), специалистом по продвижению продуктов AWS компании Amazon, спарринги проводились между четырнадцатью языковыми моделями в рамках 314 индивидуальных матчей. Здесь в конечном итоге победила языковая модель claude_3_haiku от Anthropic с рейтингом ELO 1613.


window-new
Soft
Hard
Тренды 🔥
YouTube начнёт выявлять аккаунты несовершеннолетних с помощью ИИ 5 мин.
Квадриллион токенов за месяц: Google рассказала о нагрузке на свои ИИ-сервисы в июне 9 ч.
«Аэрофлот» возобновил полёты после взлома, но масштабы и ущерб от инцидента по-прежнему неизвестны 9 ч.
Runway представила «Photoshop для видео» — ИИ-модель Aleph для быстрого редактирования видео 9 ч.
Кровавый пародийный боевик Hotel Barcelona от авторов Deadly Premonition и No More Heroes отправит игроков в отель маньяков-убийц — раскрыта дата выхода 9 ч.
Selectel запустил хранилище S3 Vault — облачное решение для резервного копирования S3-бакетов 10 ч.
ИИ-блокнот NotebookLM от Google научился создавать слайд-шоу с озвучкой 11 ч.
Выручка Yandex B2B Tech выросла во втором квартале 2025 года на 59 % 11 ч.
Bloober Team показала 35 минут геймплея Cronos: The New Dawn — фанаты Dead Space и Silent Hill в восторге 11 ч.
Windows 10 сегодня исполнилось 10 лет — вспоминаем 10 спорных и определяющих моментов в истории ОС 13 ч.
Seenda выпустила вертикальную мышь, которая управляет звуком и бесшумна 3 мин.
JPMorgan ожидает запуск первого складного iPhone в 2026 году — его цена может составить $1999 8 мин.
Накопители большой ёмкости позволили Seagate увеличить выручку на 30 %, а прибыль — в два с половиной раза 11 мин.
Власти США выдали Nvidia первые лицензии на поставки ускорителей H20 в Китай после снятия запрета 3 ч.
В прошлом квартале мировые поставки кремниевых пластин выросли на 9,6 % 4 ч.
Новая статья: Обзор материнской платы MSI MPG X870E CARBON WIFI: каждому — своё 9 ч.
Энергетическую безопасность Техаса обеспечат хранилища энергии на б/у-аккумуляторах от электромобилей 11 ч.
Razer представила киберспортивную беспроводную гарнитуру BlackShark V3 Pro в версиях для ПК, PS5 и Xbox 13 ч.
Стартап Reflect Orbital направит солнечный свет на ночную сторону Земли с помощью гигантских зеркал на орбите 13 ч.
Corsair представила мощный мини-ПК AI Workstation 300 — процессоры Ryzen AI Max и до 128 Гбайт памяти LPDDR5X 13 ч.