Сегодня 29 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → street fighter iii

Языковые модели ИИ сразились друг с другом в импровизированном турнире по Street Fighter III

На хакатоне Mistral AI, прошедшем в Сан-Франциско на минувшей неделе, разработчики Стэн Жирар (Stan Girard) и Quivr Brain представили тест LLM Colosseum с открытым исходным кодом, основанный на классическом аркадном файтинге Street Fighter III. Тест предназначен для определения самой эффективной языковой модели ИИ в не совсем традиционной, но зрелищной манере.

 Источник изображений: YouTube / Matthew Berman

Источник изображений: YouTube / Matthew Berman

ИИ-энтузиаст Мэтью Берман (Matthew Berman) решил провести с помощь теста LLM Colosseum своеобразный турнир между языковыми моделями, о чём он поделился в своём видео. В нём же Берман показал один из поединков между ИИ. Кроме того, он рассказал, как можно установить этот проект с исходным кодом на домашний ПК или Mac и оценить его самостоятельно.

Это не совсем типичный тест LLM. Как правило, маленькие языковые модели имеют преимущество в задержке и скорости, что приводит к победе в большинстве виртуальных боёв. В файтингах очень важна скорость реакции игроков на ответные действия своих оппонентов. То же правило работает и в случае противостояния ИИ против ИИ.

 Источник изображений: OpenGenerativeAI team

Источник изображений: OpenGenerativeAI team

Языковая модель в реальном времени принимает решение, как ей сражаться. Поскольку LLM представляют собой текстовые модели, их обучили в игре Street Fighter III с помощью текстовых подсказок. ИИ сначала дали проанализировать контекст игры в целом, а затем подсказали, как реагировать на то или иное игровое действие в той или иной ситуации, не забыв про вариативность ходов. ИИ обучили приближаться или отдаляться от противника, а также использовать различные приёмы вроде огненного шара, мегаудара, урагана и мегаогненного шара.

 Источник изображения: OpenGenerativeAI team

Источник изображения: OpenGenerativeAI team

Продемонстрированный на видео бой между ИИ выглядит динамично. Оппоненты действуют стратегически, блокируют удары противника и используют специальные приёмы. Однако к настоящему моменту проект LLM Colosseum позволяет использовать только одного игрового персонажа, Кена.

Согласно тестам Жирара, лучшей языковой моделью в турнире Street Fighter III оказалась GPT 3.5 Turbo от OpenAI. Среди восьми участников она достигла самого высокого рейтинга ELO — 1776.

В отдельной серии тестов, организованных Банджо Обайоми (Banjo Obayomi), специалистом по продвижению продуктов AWS компании Amazon, спарринги проводились между четырнадцатью языковыми моделями в рамках 314 индивидуальных матчей. Здесь в конечном итоге победила языковая модель claude_3_haiku от Anthropic с рейтингом ELO 1613.


window-new
Soft
Hard
Тренды 🔥
Судебные документы Sony и Tencent раскрыли актуальные продажи игр серии Horizon 2 мин.
Скоро рынок наполнится наушниками со встроенным ИИ на базе GPT-4.1 — Bragi и OpenAI договорились о партнёрстве 12 мин.
Россияне пожаловались на проблемы с доступом к сайту «Почты России», но ведомство опровергло наличие сбоев 16 мин.
Провал Suicide Squad: Kill the Justice League не остановил Warner Bros. — разработчики Gotham Knights взялись за крупнобюджетную игру-сервис 2 ч.
«Инферит ОС» (ГК Softline) запустила открытое бета-тестирование операционной системы «МСВСфера» 10 2 ч.
Американку осудили на 8,5 лет тюрьмы за помощь северокорейцам в проникновении в компании США 2 ч.
Акции Spotify упали на 8 % из-за обвалившейся выручки и плохих прогнозов 2 ч.
В ИИ-помощника программиста Amazon Q кто-то тайно внедрил опасный код — это заметили лишь через десять дней 2 ч.
Расплывчато и потенциально незаконно: эксперты — о грандиозном ИИ-плане Трампа 2 ч.
Anthropic ввела квоты на работу с Claude Code из-за чрезмерного спроса и злоупотреблений 3 ч.
Corsair представила мощный мини-ПК AI Workstation 300 — процессоры Ryzen AI Max и до 128 Гбайт памяти LPDDR5X 5 мин.
Ayaneo анонсировала складную портативную игровую консоль Pocket DS с Android и двумя экранами 20 мин.
Domino's научила робопса Boston Dynamics Spot доставлять пиццу и отгонять чаек 2 ч.
Elgato выпустила Facecam 4K — веб-камеру с поддержкой 4K при 60 FPS и сменными фильтрами за $200 2 ч.
Apple открывает академию в Детройте, чтобы научить малый бизнес умному производству в США 2 ч.
Калибровочные снимки «Джеймса Уэбба» отсеяли кандидатов на роль лёгкой тёмной материи 2 ч.
MaxLinear представила DPU Panther V с пропускной способностью 450 Гбит/с 3 ч.
HMD представила кнопочный телефон Barça 3210 — стиль Nokia, логотип «Барселоны» и поддержку DeepSeek 3 ч.
V-Color представила комплекты памяти DDR5 для Ryzen Threadripper Pro 9000 — до 2 Тбайт и до 8200 МТ/с 3 ч.
Преемник самого продаваемого Android-смартфона Samsung засветился на рендерах 5 ч.