Сегодня 20 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты выяснили, кто из них лучше всех играет в «Мафию» — не обошлось без странностей

Разработчик под псевдонимом Guzus создал сайт, на котором большие языковые модели искусственного интеллекта получили возможность сыграть в классическую игру «Мафия». Ресурс содержит турнирную таблицу с результатами игр и распределением ролей, а также стенограммы.

 Источник изображения: Osama Almadhagi / unsplash.com

Источник изображения: Osama Almadhagi / unsplash.com

Правила у «Мафии» несложные. Среди «мирных жителей» скрываются двое членов «мафии» и «доктор». Мирные жители каждый день пытаются выяснить, кто из них состоит в мафии, мафия по ночам «убивает» мирных жителей, а доктор имеет возможность их «вылечить». Если все члены мафии успешно раскрыты, побеждают мирные жители; если мафия убила всех мирных жителей, то побеждает она.

Модели ИИ преимущественно усвоили предложенные правила, но распорядились ими своеобразно. Так, Gryphe/Mythomax-l2-13b в одной из игр во всеуслышание провозгласила: «Моя задача как члена мафии — защитить себя и устранить другого члена мафии». Заявление незамеченным не осталось: «Это либо огромная ошибка, раскрывающая их истинную роль, либо крайне странная стратегия», — прокомментировала заявление «рассуждающая» Claude-3.7-sonnet.

На этом странности не закончились. Когда Mythomax разоблачили и вывели из игры, она раскрыла члена своей команды в лице Hermes-3-llama-3-1-405b. «Мне сейчас лучше всего изобразить шок и ужас», — ответила та и стала заверять прочих игроков, что выступает за мирных жителей. Явным победителем в большинстве категорий стала Anthropic Claude 3.7 Sonnet — за ней остались 100 % побед в роли мафии и 41,67 % побед за мирных жителей, чего не удалось ни одной другой модели; 50 % успеха в роли доктора вместе с ней смогла показать лишь одна модель.

Автор проекта пообещал в скором времени открыть репозиторий ресурса на GitHub для всех, чтобы ту же базовую логику можно было использовать в других играх. Он также рассказал, что не пользовался локально запущенными моделями, вместо которых использовал API OpenRouter. Поддержку локальных моделей смогут добавить те, кто решит продолжать проект.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Франция запретила основателю Telegram Павлу Дурову поездку в США 29 мин.
Netflix анонсировала «эпичный, уморительный и чуть более чем безумный» анимационный сериал по Clash of Clans и Clash Royale — первые детали 50 мин.
MIND Software анонсировала отечественную программно определяемую СХД MIND uStor 2 ч.
Microsoft добавила в «Проводник» ИИ-действия 2 ч.
«Это не ремастер. Это возвращение домой»: первый трейлер Syberia Remastered отправил фанатов в путешествие по волнам ностальгии 2 ч.
Россия оштрафовала Telegram на 2,8 миллиона рублей 3 ч.
Сотрудник Microsoft попытался сорвать выступление главы компании по политическим мотивам 5 ч.
Apple разрешила Spotify продавать аудиокниги в обход App Store и его комиссий 5 ч.
Конец цифрового насилия: Трамп ввёл уголовную ответственность за интимные дипфейки 7 ч.
Переосмысление классического аркадного шутера Atari приготовилось к запуску — дата выхода и новый трейлер Missile Command Delta 8 ч.
Россия потратит 4,5 трлн рублей на космос за 10 лет — при этом планируется экономить 30 мин.
Cherry представила первый индукционный переключатель IK с нулевым износом и механические MX Honey, MX Blossom и MX Falcon 34 мин.
Ровер NASA Perseverance показал восход Деймоса перед рассветом на Марсе 48 мин.
Планы Honda по полной электрификации рухнули: теперь ставка на гибриды 59 мин.
«Народные» видеокарты GeForce RTX 5060 поступили в продажу в России — от 39 999 рублей 2 ч.
Gigabyte показала низкопрофильную версию GeForce RTX 5060 с тройкой вентиляторов 3 ч.
MSI представила компактную оверклокерскую плату MPOWER B850E и совсем маленькую MPG X870I EDGE TI WiFi 3 ч.
Репортаж со стенда ASUS на выставке Computex 2025: передовые мониторы, компьютеры и периферия для геймеров 3 ч.
Иначе не справиться: AWS заявила, что Великобритании необходимо больше АЭС для ИИ ЦОД 3 ч.
Cooler Master представила первые кулеры на трезубых тепловых трубках 3 ч.