Сегодня 15 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → мафия

ИИ-боты выяснили, кто из них лучше всех играет в «Мафию» — не обошлось без странностей

Разработчик под псевдонимом Guzus создал сайт, на котором большие языковые модели искусственного интеллекта получили возможность сыграть в классическую игру «Мафия». Ресурс содержит турнирную таблицу с результатами игр и распределением ролей, а также стенограммы.

 Источник изображения: Osama Almadhagi / unsplash.com

Источник изображения: Osama Almadhagi / unsplash.com

Правила у «Мафии» несложные. Среди «мирных жителей» скрываются двое членов «мафии» и «доктор». Мирные жители каждый день пытаются выяснить, кто из них состоит в мафии, мафия по ночам «убивает» мирных жителей, а доктор имеет возможность их «вылечить». Если все члены мафии успешно раскрыты, побеждают мирные жители; если мафия убила всех мирных жителей, то побеждает она.

Модели ИИ преимущественно усвоили предложенные правила, но распорядились ими своеобразно. Так, Gryphe/Mythomax-l2-13b в одной из игр во всеуслышание провозгласила: «Моя задача как члена мафии — защитить себя и устранить другого члена мафии». Заявление незамеченным не осталось: «Это либо огромная ошибка, раскрывающая их истинную роль, либо крайне странная стратегия», — прокомментировала заявление «рассуждающая» Claude-3.7-sonnet.

На этом странности не закончились. Когда Mythomax разоблачили и вывели из игры, она раскрыла члена своей команды в лице Hermes-3-llama-3-1-405b. «Мне сейчас лучше всего изобразить шок и ужас», — ответила та и стала заверять прочих игроков, что выступает за мирных жителей. Явным победителем в большинстве категорий стала Anthropic Claude 3.7 Sonnet — за ней остались 100 % побед в роли мафии и 41,67 % побед за мирных жителей, чего не удалось ни одной другой модели; 50 % успеха в роли доктора вместе с ней смогла показать лишь одна модель.

Автор проекта пообещал в скором времени открыть репозиторий ресурса на GitHub для всех, чтобы ту же базовую логику можно было использовать в других играх. Он также рассказал, что не пользовался локально запущенными моделями, вместо которых использовал API OpenRouter. Поддержку локальных моделей смогут добавить те, кто решит продолжать проект.


window-new
Soft
Hard
Тренды 🔥
OpenAI создала совет по влиянию ИИ на психику пользователей — но без экспертов по предотвращению самоубийств 54 мин.
Microsoft завтра анонсирует «нечто важное» для Windows 2 ч.
Не просто порт, а «новая эра браузерного ретрогейминга»: энтузиасты реализовали веб-версию мультиплеера классической Doom 2 ч.
«Call of Duty существует только потому, что EA были мерзавцами»: босс Battlefield объяснил, как появился главный конкурент Battlefield 3 ч.
«Один из самых красивых городов во всём Тамриэле»: художник поразил фанатов реалистичным переосмыслением Скинграда из The Elder Scrolls IV: Oblivion 4 ч.
ChatGPT научится вести разговоры для взрослых, но только с проверенными взрослыми 5 ч.
Биткоин и золото движутся синхронно — корреляция вплотную подошла к историческому максимуму 5 ч.
От GTX 1060 до RTX 5080: разработчики Vampire: The Masquerade — Bloodlines 2 объявили полные системные требования игры 5 ч.
Ближе к Call of Duty, чем когда-либо: аналитики раскрыли ударные продажи Battlefield 6 6 ч.
Microsoft выпустила последний пакет обновлений для Windows 10 7 ч.
iPhone 17 оживил продажи смартфонов Apple в Китае 2 мин.
Беспилотные такси Waymo преодолеют океан — в следующем году они выйдут на улицы Лондона 12 мин.
В России собрались построить свой космоплан — в теории его уже просчитали 18 мин.
Верховный суд поставил точку в деле московского изобретателя против Apple 22 мин.
МВФ: мир уже прошёл половину пути до лопнувшего ИИ-пузыря и нового финансового кризиса 28 мин.
Первая гарнитура на Android XR дебютирует на следующей неделе — Samsung представит Project Moohan 49 мин.
Broadcom представила первые в мире 800GbE-адаптеры Thor Ultra с поддержкой Ultra Ethernet для масштабных ИИ-кластеров 2 ч.
Квартальная выручка неооблаков выросла на 200 %, а в 2030 году она достигнет $180 млрд 2 ч.
«Пьяные матросы с долговыми расписками»: как OpenAI ищет $1 трлн, не предлагая ничего взамен 3 ч.
Oracle запустит в 2026 году ИИ-кластер на базе 50 тыс. AMD Instinct MI450 3 ч.