Сегодня 24 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → мафия

ИИ-боты выяснили, кто из них лучше всех играет в «Мафию» — не обошлось без странностей

Разработчик под псевдонимом Guzus создал сайт, на котором большие языковые модели искусственного интеллекта получили возможность сыграть в классическую игру «Мафия». Ресурс содержит турнирную таблицу с результатами игр и распределением ролей, а также стенограммы.

 Источник изображения: Osama Almadhagi / unsplash.com

Источник изображения: Osama Almadhagi / unsplash.com

Правила у «Мафии» несложные. Среди «мирных жителей» скрываются двое членов «мафии» и «доктор». Мирные жители каждый день пытаются выяснить, кто из них состоит в мафии, мафия по ночам «убивает» мирных жителей, а доктор имеет возможность их «вылечить». Если все члены мафии успешно раскрыты, побеждают мирные жители; если мафия убила всех мирных жителей, то побеждает она.

Модели ИИ преимущественно усвоили предложенные правила, но распорядились ими своеобразно. Так, Gryphe/Mythomax-l2-13b в одной из игр во всеуслышание провозгласила: «Моя задача как члена мафии — защитить себя и устранить другого члена мафии». Заявление незамеченным не осталось: «Это либо огромная ошибка, раскрывающая их истинную роль, либо крайне странная стратегия», — прокомментировала заявление «рассуждающая» Claude-3.7-sonnet.

На этом странности не закончились. Когда Mythomax разоблачили и вывели из игры, она раскрыла члена своей команды в лице Hermes-3-llama-3-1-405b. «Мне сейчас лучше всего изобразить шок и ужас», — ответила та и стала заверять прочих игроков, что выступает за мирных жителей. Явным победителем в большинстве категорий стала Anthropic Claude 3.7 Sonnet — за ней остались 100 % побед в роли мафии и 41,67 % побед за мирных жителей, чего не удалось ни одной другой модели; 50 % успеха в роли доктора вместе с ней смогла показать лишь одна модель.

Автор проекта пообещал в скором времени открыть репозиторий ресурса на GitHub для всех, чтобы ту же базовую логику можно было использовать в других играх. Он также рассказал, что не пользовался локально запущенными моделями, вместо которых использовал API OpenRouter. Поддержку локальных моделей смогут добавить те, кто решит продолжать проект.


window-new
Soft
Hard
Тренды 🔥
YouTube объявил амнистию для блогеров, заблокированных за фейки о COVID-19 и выборах 3 ч.
Японский Amazon рассекретил дату выхода Nioh 3 до официального анонса 3 ч.
«Google Фото» теперь редактирует снимки по голосовым командам — функция вышла за пределы Pixel 5 ч.
Yakuza Kiwami 3 выйдет с переводом на русский и сюжетным дополнением про главного злодея — дата релиза и первый трейлер ремейка Yakuza 3 6 ч.
Китайский пользователь первым в истории Steam собрал на аккаунте более 40 000 игр 16 ч.
ChatGPT обманом заставили пройти CAPTCHA — интернет могут наводнить фейковые публикации от ИИ 16 ч.
«Google Документы» получат дизайн с стиле Material 3 Expressive и новые фильтры поиска 17 ч.
Голосовой ИИ-помощник Gemini Live поможет в прохождении игр на Android 18 ч.
В WhatsApp встроили бесплатный переводчик сообщений, в том числе на русский 18 ч.
Закрытая «бета» файтинга 2XKO по League of Legends продлится всего месяц — Riot объявила дату выхода игры в раннем доступе 20 ч.
Переход на 5G привёл к ухудшению качества связи в некоторых городах Европы и Северной Америки 25 мин.
Samsung прибрала к рукам Bowers & Wilkins, Denon, Marantz и ещё пятёрку брендов аудиотехники 36 мин.
Logitech представила беспроводную клавиатуру, которая заряжается от лампочки — Signature Slim Solar Plus K980 2 ч.
Raspberry Pi готовит вычислительный модуль CM0 с поддержкой Wi-Fi 4 и Bluetooth 4.2 LE 2 ч.
На краю Солнечной системы засекли вероятный взрыв первичной чёрной дыры — это приблизит учёных к пониманию тёмной материи 2 ч.
Гигаватт в неделю: OpenAI задумала развернуть крупнейшее производство ИИ-инфраструктуры 2 ч.
Samsung вернулась в гонку за рынок памяти для ИИ — её доля на рынке HBM превысит 30 % в следующем году 3 ч.
В России поступили в продажу смартфоны Infinix HOT 60 Pro и HOT 60 Pro+ по цене от 12 990 рублей 3 ч.
OpenAI, Oracle и SoftBank построят в США ещё пять ИИ ЦОД для проекта Stargate 3 ч.
В MIT создали магнитный транзистор с памятью — на порядок мощнее всех существующих 3 ч.