Сегодня 20 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → мафия

ИИ-боты выяснили, кто из них лучше всех играет в «Мафию» — не обошлось без странностей

Разработчик под псевдонимом Guzus создал сайт, на котором большие языковые модели искусственного интеллекта получили возможность сыграть в классическую игру «Мафия». Ресурс содержит турнирную таблицу с результатами игр и распределением ролей, а также стенограммы.

 Источник изображения: Osama Almadhagi / unsplash.com

Источник изображения: Osama Almadhagi / unsplash.com

Правила у «Мафии» несложные. Среди «мирных жителей» скрываются двое членов «мафии» и «доктор». Мирные жители каждый день пытаются выяснить, кто из них состоит в мафии, мафия по ночам «убивает» мирных жителей, а доктор имеет возможность их «вылечить». Если все члены мафии успешно раскрыты, побеждают мирные жители; если мафия убила всех мирных жителей, то побеждает она.

Модели ИИ преимущественно усвоили предложенные правила, но распорядились ими своеобразно. Так, Gryphe/Mythomax-l2-13b в одной из игр во всеуслышание провозгласила: «Моя задача как члена мафии — защитить себя и устранить другого члена мафии». Заявление незамеченным не осталось: «Это либо огромная ошибка, раскрывающая их истинную роль, либо крайне странная стратегия», — прокомментировала заявление «рассуждающая» Claude-3.7-sonnet.

На этом странности не закончились. Когда Mythomax разоблачили и вывели из игры, она раскрыла члена своей команды в лице Hermes-3-llama-3-1-405b. «Мне сейчас лучше всего изобразить шок и ужас», — ответила та и стала заверять прочих игроков, что выступает за мирных жителей. Явным победителем в большинстве категорий стала Anthropic Claude 3.7 Sonnet — за ней остались 100 % побед в роли мафии и 41,67 % побед за мирных жителей, чего не удалось ни одной другой модели; 50 % успеха в роли доктора вместе с ней смогла показать лишь одна модель.

Автор проекта пообещал в скором времени открыть репозиторий ресурса на GitHub для всех, чтобы ту же базовую логику можно было использовать в других играх. Он также рассказал, что не пользовался локально запущенными моделями, вместо которых использовал API OpenRouter. Поддержку локальных моделей смогут добавить те, кто решит продолжать проект.


window-new
Soft
Hard
Тренды 🔥
ChatGPT перестал работать у многих пользователей по всему миру — OpenAI ведёт расследование 14 мин.
«Кто-то изучает историю, а кто-то её творит»: первый геймплейный трейлер Tropico 7 показал, каково управлять райским островом 25 мин.
ИИ стал оружием хакеров: кибератаки стали быстрее и сложнее 2 ч.
В российском Steam открылся предзаказ постапокалиптического боевика Beast of Reincarnation от создателей «Покемонов» 2 ч.
Дата выхода, актёрский состав и самый амбициозный проект A24: раскрыты новые подробности фильма по Elden Ring 3 ч.
Microsoft повысила скорость и производительность «Проводника» в Windows 11 3 ч.
Релиз российской облачной платформы KeyStack 2026.1: расширенная Enterprise-функциональность и архитектура Secure by Default 3 ч.
Vitality разгромила Spirit в финале IEM Rio 2026 и выиграла $1 млн в золотых слитках в гонке Grand Slam 7 ч.
Спустя 28 лет фанаты раскрыли «один из старейших» секретов The Elder Scrolls — что скрывается под женскими юбками в Redguard 7 ч.
Регуляторы увидели в ИИ-модели Anthropic Mythos угрозу для банковской системы 8 ч.
AMD поможет в развитии экосистемы ИИ во Франции 8 мин.
Представлены смарт-очки Huawei AI Glasses со встроенной камерой и переводчиком за $370 11 мин.
Toshiba предложила ждать замену HDD по гарантии до года или возместить деньги по старой цене 40 мин.
Командир лунной миссии Artemis II опубликовал потрясающее видео «заката Земли», снятое на iPhone 2 ч.
Похоже, OnePlus всё же уходит из Европы — на это намекает увольнение десятков ключевых сотрудников 2 ч.
Huawei представила конкурента MacBook — MateBook 14 HarmonyOS Edition с круглыми клавишами, фирменной ОС и чипом Kirin X90 2 ч.
Huawei представила смарт-часы Watch Ultimate Star Diamond Edition с 99 бриллиантами и оценкой риска гипергликемии 2 ч.
Ещё капельку: XPO-модули повысят плотность сетей в ИИ ЦОД, но CPO всё равно не избежать 2 ч.
Huawei представила смарт-часы Watch Fit 5 и Fit 5 Pro c измерением ЭКГ и уровня сахара в крови 3 ч.
Гиперскейлеры убедили Евросоюз, что экологические показатели ЦОД — это коммерческая тайна 4 ч.