Сегодня 19 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты выяснили, кто из них лучше всех играет в «Мафию» — не обошлось без странностей

Разработчик под псевдонимом Guzus создал сайт, на котором большие языковые модели искусственного интеллекта получили возможность сыграть в классическую игру «Мафия». Ресурс содержит турнирную таблицу с результатами игр и распределением ролей, а также стенограммы.

 Источник изображения: Osama Almadhagi / unsplash.com

Источник изображения: Osama Almadhagi / unsplash.com

Правила у «Мафии» несложные. Среди «мирных жителей» скрываются двое членов «мафии» и «доктор». Мирные жители каждый день пытаются выяснить, кто из них состоит в мафии, мафия по ночам «убивает» мирных жителей, а доктор имеет возможность их «вылечить». Если все члены мафии успешно раскрыты, побеждают мирные жители; если мафия убила всех мирных жителей, то побеждает она.

Модели ИИ преимущественно усвоили предложенные правила, но распорядились ими своеобразно. Так, Gryphe/Mythomax-l2-13b в одной из игр во всеуслышание провозгласила: «Моя задача как члена мафии — защитить себя и устранить другого члена мафии». Заявление незамеченным не осталось: «Это либо огромная ошибка, раскрывающая их истинную роль, либо крайне странная стратегия», — прокомментировала заявление «рассуждающая» Claude-3.7-sonnet.

На этом странности не закончились. Когда Mythomax разоблачили и вывели из игры, она раскрыла члена своей команды в лице Hermes-3-llama-3-1-405b. «Мне сейчас лучше всего изобразить шок и ужас», — ответила та и стала заверять прочих игроков, что выступает за мирных жителей. Явным победителем в большинстве категорий стала Anthropic Claude 3.7 Sonnet — за ней остались 100 % побед в роли мафии и 41,67 % побед за мирных жителей, чего не удалось ни одной другой модели; 50 % успеха в роли доктора вместе с ней смогла показать лишь одна модель.

Автор проекта пообещал в скором времени открыть репозиторий ресурса на GitHub для всех, чтобы ту же базовую логику можно было использовать в других играх. Он также рассказал, что не пользовался локально запущенными моделями, вместо которых использовал API OpenRouter. Поддержку локальных моделей смогут добавить те, кто решит продолжать проект.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Heroes of Might & Magic: Olden Era впервые в истории франшизы получит режим наблюдателя — игроки просили об этом годами 38 мин.
Whiskerwood получила дату выхода в раннем доступе и демоверсию в Steam — это градостроительная стратегия, в которой коты поработили мышей 2 ч.
Разработчики Bomb Rush Cyberfunk анонсировали «экстремальную игру о трюках и граффити из светлого будущего» — первый тизер и детали Hyperfunk 4 ч.
Вышли первые приложения, использующие локальные модели ИИ Apple в iOS 26 — пока не впечатляет 4 ч.
No Man’s Sky встречает Helldivers 2: в раннем доступе стартовал PvE-шутер Jump Space с бесшовным переходом между сражениями на земле и в космосе 4 ч.
Британские банки до сих пор работают на софте 60-летней давности 5 ч.
Легендарный мультиплеер Quake II теперь доступен и в браузере, причём совершенно бесплатно 5 ч.
Инсайдер призвал не ждать новостей о Bloodborne — с культовым эксклюзивом PS4 не происходит «ровным счётом ничего» 6 ч.
Google Chrome получил экстренное обновление из-за уязвимости, через которую вовсю взламывались ПК 6 ч.
ChatGPT превратили в сообщника при краже секретных данных из Gmail 7 ч.
Цены GeForce RTX 5000 наконец упали до рекомендованных, но лишь в США — на это ушло меньше года 7 мин.
Марс получится подключить к Земле в помощью лазеров — эксперименты NASA на «Психее» превзошли ожидания 2 ч.
ИИ вернул моду на жёсткие диски — спрос подскочил впервые за годы, и это только начало 4 ч.
ASRock представила Radeon RX 7700 Challenger и раскрыла частоты новой видеокарты AMD 4 ч.
Внутри пауэрбанка iPhone Air MagSafe оказался аккумулятор от самого iPhone Air — но зарядить смартфон полностью не получится 4 ч.
Vantage вложит €3,2 млрд в кампус ЦОД в испанской Сарагосе 6 ч.
Apple рассказала, как Watch научились предупреждать пользователей о высоком артериальном давлении с помощью ИИ 7 ч.
Новая статья: Обзор умных часов HUAWEI WATCH GT 6 Pro: три недели на одном заряде 7 ч.
Huawei представила смарт-часы Watch GT 6 и GT 6 Pro с автономностью до 21 дня 7 ч.
Huawei представила глобальные версии смартфонов Nova 14 и 14 Pro с мощными камерами 7 ч.