Сегодня 30 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты выяснили, кто из них лучше всех играет в «Мафию» — не обошлось без странностей

Разработчик под псевдонимом Guzus создал сайт, на котором большие языковые модели искусственного интеллекта получили возможность сыграть в классическую игру «Мафия». Ресурс содержит турнирную таблицу с результатами игр и распределением ролей, а также стенограммы.

 Источник изображения: Osama Almadhagi / unsplash.com

Источник изображения: Osama Almadhagi / unsplash.com

Правила у «Мафии» несложные. Среди «мирных жителей» скрываются двое членов «мафии» и «доктор». Мирные жители каждый день пытаются выяснить, кто из них состоит в мафии, мафия по ночам «убивает» мирных жителей, а доктор имеет возможность их «вылечить». Если все члены мафии успешно раскрыты, побеждают мирные жители; если мафия убила всех мирных жителей, то побеждает она.

Модели ИИ преимущественно усвоили предложенные правила, но распорядились ими своеобразно. Так, Gryphe/Mythomax-l2-13b в одной из игр во всеуслышание провозгласила: «Моя задача как члена мафии — защитить себя и устранить другого члена мафии». Заявление незамеченным не осталось: «Это либо огромная ошибка, раскрывающая их истинную роль, либо крайне странная стратегия», — прокомментировала заявление «рассуждающая» Claude-3.7-sonnet.

На этом странности не закончились. Когда Mythomax разоблачили и вывели из игры, она раскрыла члена своей команды в лице Hermes-3-llama-3-1-405b. «Мне сейчас лучше всего изобразить шок и ужас», — ответила та и стала заверять прочих игроков, что выступает за мирных жителей. Явным победителем в большинстве категорий стала Anthropic Claude 3.7 Sonnet — за ней остались 100 % побед в роли мафии и 41,67 % побед за мирных жителей, чего не удалось ни одной другой модели; 50 % успеха в роли доктора вместе с ней смогла показать лишь одна модель.

Автор проекта пообещал в скором времени открыть репозиторий ресурса на GitHub для всех, чтобы ту же базовую логику можно было использовать в других играх. Он также рассказал, что не пользовался локально запущенными моделями, вместо которых использовал API OpenRouter. Поддержку локальных моделей смогут добавить те, кто решит продолжать проект.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Отечественные сервисы видеосвязи захватили более 90 % корпоративного рынка в России 3 ч.
В Telegram появилась «Проверка фактов», но не у всех 6 ч.
Слухи: Bethesda подготовила новые трейлеры The Elder Scrolls VI, но не для широкой публики 6 ч.
Восток и Запад встречаются в дебютном трейлере дополнения Badlands к симулятору выживания DayZ 6 ч.
Безоговорочный возврат средств, скидка за лояльность и план патчей: создатели провального ремастера Warhammer 40,000: Space Marine обратились к игрокам 6 ч.
AirPods с живым переводом и Wi-Fi без паролей могут появиться в iOS 26 уже осенью 11 ч.
Президент США заявил, что покупатель для американских активов TikTok найден 11 ч.
Baidu откроет исходный код Ernie, что может изменить расстановку сил на мировом ИИ-рынке 11 ч.
Microsoft заявила, что ПК с Windows 11 в 2,3 раза быстрее ПК с Windows 10 и привела сомнительные аргументы 24 ч.
Meta переманила из OpenAI ещё четырёх специалистов в области ИИ 29-06 06:57
Б/у автоаккумуляторы запитали ИИ ЦОД с 2 тыс. ускорителей 42 мин.
Anker отзовёт ещё несколько миллионов пауэрбанков с потенциально пожароопасными элементами 2 ч.
Samsung до сих пор не хватает собственной памяти LPDDR5X для смартфонов Galaxy S25 4 ч.
SiPearl Seine — сервер эталонного дизайна для европейских Arm-процессоров Rhea1 4 ч.
Apple разрабатывает сразу семь устройств виртуальной и дополненной реальности — первое выйдет уже в этом году 5 ч.
ATP представила индустриальные SSD серий N651Si/N651Sc с повышенной долговечностью 5 ч.
Китайские электромобили станут безопаснее: власти ужесточат требования к защите батарей от возгораний и взрывов 6 ч.
Албания присоединилась к европейской суперкомпьютерной программе EuroHPC JU 6 ч.
HUAWEI nova Y73: самый недорогой смартфон с кремний-углеродной батареей 8 ч.
CoreWeave снова пытается купить оператора ЦОД Core Scientific, от которого зависит бизнес компании 8 ч.