Сегодня 20 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты выяснили, кто из них лучше всех играет в «Мафию» — не обошлось без странностей

Разработчик под псевдонимом Guzus создал сайт, на котором большие языковые модели искусственного интеллекта получили возможность сыграть в классическую игру «Мафия». Ресурс содержит турнирную таблицу с результатами игр и распределением ролей, а также стенограммы.

 Источник изображения: Osama Almadhagi / unsplash.com

Источник изображения: Osama Almadhagi / unsplash.com

Правила у «Мафии» несложные. Среди «мирных жителей» скрываются двое членов «мафии» и «доктор». Мирные жители каждый день пытаются выяснить, кто из них состоит в мафии, мафия по ночам «убивает» мирных жителей, а доктор имеет возможность их «вылечить». Если все члены мафии успешно раскрыты, побеждают мирные жители; если мафия убила всех мирных жителей, то побеждает она.

Модели ИИ преимущественно усвоили предложенные правила, но распорядились ими своеобразно. Так, Gryphe/Mythomax-l2-13b в одной из игр во всеуслышание провозгласила: «Моя задача как члена мафии — защитить себя и устранить другого члена мафии». Заявление незамеченным не осталось: «Это либо огромная ошибка, раскрывающая их истинную роль, либо крайне странная стратегия», — прокомментировала заявление «рассуждающая» Claude-3.7-sonnet.

На этом странности не закончились. Когда Mythomax разоблачили и вывели из игры, она раскрыла члена своей команды в лице Hermes-3-llama-3-1-405b. «Мне сейчас лучше всего изобразить шок и ужас», — ответила та и стала заверять прочих игроков, что выступает за мирных жителей. Явным победителем в большинстве категорий стала Anthropic Claude 3.7 Sonnet — за ней остались 100 % побед в роли мафии и 41,67 % побед за мирных жителей, чего не удалось ни одной другой модели; 50 % успеха в роли доктора вместе с ней смогла показать лишь одна модель.

Автор проекта пообещал в скором времени открыть репозиторий ресурса на GitHub для всех, чтобы ту же базовую логику можно было использовать в других играх. Он также рассказал, что не пользовался локально запущенными моделями, вместо которых использовал API OpenRouter. Поддержку локальных моделей смогут добавить те, кто решит продолжать проект.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Solarpunk — выживание под солнечными лучами. Рецензия 7 ч.
Google DeepMind покинул лауреат Нобелевской премии Джон Джампер — он перейдёт в Anthropic 7 ч.
«Спасибо за вашу страсть к игре»: Valve поздравила Counter-Strike с 27-летием 10 ч.
Никакого ИИ в браузере — Vivaldi пообещала «сохранить человеческий подход к просмотру веб-страниц» 12 ч.
Слухи: амбициозный самурайский боевик Onimusha: Way of the Sword от Capcom выйдет на три недели раньше запланированного 13 ч.
Google заявила о готовности запустить программу верификации разработчиков и приложений 14 ч.
В последнем обновлении Windows 11 сломалась «Корзина» и запуск приложений Office 15 ч.
У Google Android 17 проявились первые сбои: исчезают виджеты, отказывает Wi-Fi в приложениях 17 ч.
Alibaba Cloud делает ставку на развитие во Франции, а Европа желает получить больше контроля над ИИ-инфраструктурой 17 ч.
Глава PlayStation уклонился от ответа на вопрос о будущем эксклюзивов Sony на ПК, но инсайдер прояснил план компании 17 ч.
Hyundai полностью выкупит Boston Dynamics у SoftBank 6 ч.
«Логарифмический» ИИ-ускоритель Tensordyne Napier обещает выскоую производительность при минимальном энергопотреблении 11 ч.
Современные роботы освоили многое, но окружающий мир они всё ещё не понимают 11 ч.
«Не можем создать смартфон», — Nothing отменила выпуск CMF Phone 3 Pro из-за роста цен на память 13 ч.
Сбербанк этой осенью представит человекоподобных роботов собственной разработки 14 ч.
Потребительский SATA SSD выдержал 15 000 полных перезаписей за 16 лет и продолжает работать 14 ч.
Cloud.ru начал строительство собственного ЦОД в Московской области 15 ч.
В Тасмании начали строить «чёрный ящик Земли» — сверхзащищённый бункер с климатическим архивом планеты 15 ч.
Выход SpaceX на биржу сделал миллиардерами членов совета директоров и сотрудников компании 15 ч.
MaxSun выпустила материнские платы Mini-ITX с разъёмами MCIO вместо привычных PCIe x16 15 ч.