Сегодня 10 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты выяснили, кто из них лучше всех играет в «Мафию» — не обошлось без странностей

Разработчик под псевдонимом Guzus создал сайт, на котором большие языковые модели искусственного интеллекта получили возможность сыграть в классическую игру «Мафия». Ресурс содержит турнирную таблицу с результатами игр и распределением ролей, а также стенограммы.

 Источник изображения: Osama Almadhagi / unsplash.com

Источник изображения: Osama Almadhagi / unsplash.com

Правила у «Мафии» несложные. Среди «мирных жителей» скрываются двое членов «мафии» и «доктор». Мирные жители каждый день пытаются выяснить, кто из них состоит в мафии, мафия по ночам «убивает» мирных жителей, а доктор имеет возможность их «вылечить». Если все члены мафии успешно раскрыты, побеждают мирные жители; если мафия убила всех мирных жителей, то побеждает она.

Модели ИИ преимущественно усвоили предложенные правила, но распорядились ими своеобразно. Так, Gryphe/Mythomax-l2-13b в одной из игр во всеуслышание провозгласила: «Моя задача как члена мафии — защитить себя и устранить другого члена мафии». Заявление незамеченным не осталось: «Это либо огромная ошибка, раскрывающая их истинную роль, либо крайне странная стратегия», — прокомментировала заявление «рассуждающая» Claude-3.7-sonnet.

На этом странности не закончились. Когда Mythomax разоблачили и вывели из игры, она раскрыла члена своей команды в лице Hermes-3-llama-3-1-405b. «Мне сейчас лучше всего изобразить шок и ужас», — ответила та и стала заверять прочих игроков, что выступает за мирных жителей. Явным победителем в большинстве категорий стала Anthropic Claude 3.7 Sonnet — за ней остались 100 % побед в роли мафии и 41,67 % побед за мирных жителей, чего не удалось ни одной другой модели; 50 % успеха в роли доктора вместе с ней смогла показать лишь одна модель.

Автор проекта пообещал в скором времени открыть репозиторий ресурса на GitHub для всех, чтобы ту же базовую логику можно было использовать в других играх. Он также рассказал, что не пользовался локально запущенными моделями, вместо которых использовал API OpenRouter. Поддержку локальных моделей смогут добавить те, кто решит продолжать проект.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Производитель игрушек «засветил» Fallout 3 Remastered 25 мин.
IBM второй раз пытается заключить контракт с Почтой Великобритании для замены скандального софта Horizon 59 мин.
ChatGPT научился распознавать музыку — в него интегрировали Shazam 2 ч.
Сюжетное дополнение, фоторежим и майский сюрприз: Capcom рассказала, как будет развивать Resident Evil Requiem 2 ч.
Против Valve подали второй судебный иск из-за лутбоксов 2 ч.
Microsoft отложила принудительный переход на новый Outlook — он ещё не готов полностью 4 ч.
Не чипами едиными: Nvidia запустит открытую платформу NemoClaw для создания ИИ-агентов 4 ч.
Анонимность в интернете под угрозой: ИИ научился вычислять реальных владельцев фейковых аккаунтов 4 ч.
«Вот чем могла и должна была быть Rainbow Six Siege»: геймплейный трейлер шутера Method of Entry впечатлил поклонников жанра 4 ч.
Олдскульная стратегия Xenonauts 2 в духе старых XCOM готова к высадке из раннего доступа 5 ч.
Groq увеличил заказ на производство чипов у Samsung более чем в 1,5 раза 24 мин.
Samsung тестирует кремний-углеродные батареи для электроники на 12 000 и 18 000 мА·ч — вариант на 20 000 мА·ч провалил испытания 27 мин.
Гендиректор Phison: «ни денег, ни запасов не хватит» — цены на NAND продолжат расти астрономическими темпами 31 мин.
В ближайшие часы на Землю упадёт старый 600-кг спутник NASA — вероятность жертв и разрушений признана незначительной 46 мин.
Память для флагманов нового поколения: SK hynix готовит 16-гигабитные чипы LPDDR6 со скоростью 10,7 Гбит/c 53 мин.
KKR задумала продать производителя систем охлаждения для ЦОД CoolIT почти в 10 раз дороже, чем покупала 2 ч.
Строитель ИИ-фабрик Nscale привлёк ещё $2 млрд 2 ч.
CNBC: Oracle строит «вчерашние» дата-центры за счёт будущих долгов 2 ч.
Складной смартфон Google Pixel 11 Pro Fold показался на изображениях — внешних изменений минимум 3 ч.
Asus выпустила NUC 16 Pro — мини-ПК на чипах Intel Panther Lake для локального запуска ИИ-моделей 3 ч.