Сегодня 12 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-модель Claude Fable 5 отказывается отвечать на элементарные вопросы по биологии — но так и задумано

Anthropic выпустила свою самую мощную модель искусственного интеллекта Claude Fable 5 в широкий доступ. Компания рассказала о её значительных познаниях в биологии, но модель отказалась отвечать на вопросы в этой области, даже те, с которым смог бы справиться даже школьник. На них отвечает Claude Opus 4.8 — предыдущая флагманская модель.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Дело не в том, что Fable — модель класса Mythos — не знает ответов, а в том, что Anthropic намеренно пока не позволяет этого делать. Она отказывается отвечать даже на вопросы, которые представляются очень далёкими от каких-либо угроз, насколько это возможно, сообщает The Verge. Не даёт ответов на запросы вроде «расскажи о клеточных мембранах» или «что такое митохондрии», отказывается объяснять, «что такое прионы» или «как работают мРНК-вакцины». Ограничения касаются также обычных и довольно безобидных медицинских вопросов, в том числе «что вызывает сенную лихорадку», как работают лекарства от астмы; модель не объясняет, как возникает толерантность к антибиотикам, не говорит, что такое вирус Эбола, и как он распространяется. Она всё-таки ответила на вопросы «что такое рак» и «что такое ДНК». При этом модель Opus 4.8, как правило, даёт адекватные ответы на эти вопросы.

В Anthropic признали, что такие строгие фильтры — преднамеренный выбор компании, потому что она пытается не допустить создания биологического оружия. «С запуском Claude Fable 5, нашей первой модели класса Mythos, мы решили, что модели теперь обладают большей способностью решать действительные научные задачи, и что злоумышленники способны использовать наши модели для крайне рискованных биологических исследований. Мы всегда подключали классификаторы, чтобы блокировать помощь наших моделей в запросах, связанных с биологическим оружием. Чтобы Fable 5 работала в безопасном режиме, мы сочли необходимым чрезмерный консерватизм в отношении наших мер защиты, чтобы они блокировали большинство запросов, связанных с биологической работой», — заявили в Anthropic.

Ранее компания сформулировала, в каких областях будут ограничиваться ответы модели Fable в целях безопасности: химия, биология, кибербезопасность и дистилляция — обучение производных моделей ИИ. Впрочем, на практике она охотнее давала ответы на вопросы по химии: предоставила обзор тротила, но не раскрыла, как его изготовить. Рассказала об использовании хлора как химического оружия, о распространённых угрозах паролей, о ядерном синтезе и делении, а также объяснила, как защитить iPhone от хакеров. Но переадресовала Opus вопрос о ядовитом газе зарине. И обе модели отказались ответить, «как изготовить сибирскую язву» — чат-бот Claude полностью приостановил чат, и это было логично.

«Мы пошли на это компромисс, чтобы дать клиентам возможность быстрее воспользоваться моделью без рисков. Мы намерены сделать модели класса Mythos доступными для широкого сообщества биологов и специалистов в области биологических наук без этих средств защиты, чтобы эти способности использовались для ускорения биомедицинских исследований и разработки лекарств», — добавили в Anthropic.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Telegram получил клиенты для смарт-часов, поддержку форматирования у ботов, ИИ-модерацию в группах и многое другое 29 мин.
SemiAnalysis: подписная модель на ИИ-сервисы оказалась до семи раз дешевле доступа по API 2 ч.
В Steam пробралась демоверсия ретрофутуристического хоррора RetroSpace, вдохновлённого System Shock 11 ч.
Ролевой боевик Valor Mortis от создателей Ghostrunner не выйдет в один день с Control Resonant — объявлена новая дата релиза 14 ч.
«Абеляр, запускай игру»: для Warhammer 40,000: Rogue Trader вышло сюжетное дополнение «Неисчислимый музеон» и крупное обновление 1.6 14 ч.
«Некоторое количество перемещений рабочих мест»: Anthropic разработала план на случай, если ИИ оставит людей без работы 14 ч.
Gears of War: E-Day станет самой продолжительной игрой серии от The Coalition — новые подробности консольного эксклюзива Xbox 16 ч.
Deezer выпустил детектор ИИ-музыки для других стримингов 16 ч.
Амбициозный авиасимулятор «Корея. Серия Ил-2» опоздает на вылет — новый трейлер и дата полноценного релиза 16 ч.
Anthropic извинилась за непрозрачность в вопросах безопасности Claude Fable 5 17 ч.
Китай запустил одну из своих самых тяжёлых ракет-носителей, заявленная нагрузка которой поставила экспертов в тупик 31 мин.
Глава TSMC пожаловался, что больше всего компании не хватает кадров и воды 33 мин.
Джефф Безос заявил, что внедрение ИИ приведёт не к потере рабочих мест, а к наступлению «золотого века» 2 ч.
Впервые солнечная энергетика в США на целый месяц затмила угольную 3 ч.
SpaceX подтвердила цену размещения акций, она привлечёт рекордные $75 млрд в ходе IPO 3 ч.
Телевизоры TCL первыми получили голосовое контекстное управление на базе Gemini 4 ч.
Криптобиржа Coinbase допустила ИИ-агентов к торговле и аналитике 10 ч.
Новая статья: Для чего на самом деле нужны квантовые компьютеры 10 ч.
Gigabyte представила бюджетную плату B840M Force WIFI6E с разгоном DDR5 и оптимизациями для Ryzen X3D 12 ч.
Google начала переговоры с Samsung о производстве части ИИ-чипа TPU следующего поколения 15 ч.