Сегодня 02 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты повадились рассказывать истории об Элиасе Торне — и никто не знает, кто это такой

Программист Дэниел Мэй (Daniel May) одним из первых обратил внимание, что ИИ-боты разных компаний регулярно упоминают в генерируемых ими рассказах некоего Элиаса Торна. Некоторое время оставалось загадкой, кто это на самом деле. Теперь же опубликован отчёт по результатам исследования данного вопроса. Вероятно, упоминания Торна в рассказах ИИ связаны с работой ограничительных механизмов нейросетей, устанавливаемых в процессе обучения систем в целях безопасности.

 Источник изображения: BoliviaInteligente / Unsplash

Источник изображения: BoliviaInteligente / Unsplash

Разобраться в этом вопросе решили исследователи Корнеллского университета в США Сайл Гамильтон (Sil Hamilton) и Дэвид Мимно (David Mimno). Они использовали несколько ИИ-моделей, включая OpenAI GPT-5.4 Mini, Anthropic Claude Haiku 4.5 и Google Gemini 3.1 Flash Lite, для генерации рассказов на основании пяти разных подсказок. После этого они проанализировали около 20 тыс. сгенерированных ИИ-ботами историй и обнаружили поразительное количество повторений.

Оказалось, что слова «маяк», «смотритель», «пекарь», «мэр», «часовщик», «рыбак», «библиотекарь», «кондуктор», а также имена «Мара», «Элиас» и «Элара» встречаются в 88 % всех сгенерированных историй. Ни одна комбинация из этого небольшого набора существительных не встречается чаще, чем «Элиас, смотритель маяка». Она обнаружилась в двух третях сгенерированных рассказов.

Так в чём же дело? Сначала исследователи предположили, что это может быть связано с данными, которые использовались для обучения языковых моделей. Однако от этой идеи они отказались, когда не смогли найти подтверждений того, что словосочетание «Элиас, смотритель маяка» с чрезмерной частотой встречается в наборах, используемых для обучения данных, или в литературе.

Исследователи связали рассматриваемую особенность с конкретным набором данных, который активно использовался для обучения ИИ-моделей разными разработчиками. В качестве примера они привели WildChat — открытый набор данных, состоящий из миллионов разговоров людей с чат-ботом на базе GPT-3.5. Этот набор данных создали для того, чтобы помочь исследователям понять, как люди общаются с ботами, но с тех пор его множество раз задействовали для обучения ИИ-моделей.

Исследователи предполагают, что рассматриваемая особенность при генерации историй ИИ-ботами обусловлена работой защитных механизмов, которые должны уводить ИИ-модели от защищённых авторским правом персонажей и контента для взрослых. Вероятно, в результате этого и появились «безопасные» альтернативы, такие как «Элиас, смотритель маяка». Отмечается, что имя Элиас можно встретить не только в сгенерированных детских сказках, но и в рассказах в жанре фэнтези. Элиас Торн также был обнаружен как автор книг, включая справочник с информацией об альтернативных способах лечения рака.

Как бы то ни было, странная особенность повествования ИИ-моделей является хорошим напоминанием о том, что нейросети не креативны. Проведённое в прошлом году исследование показало, что ИИ-модели создают изображения, попадающие в 1 из всего 12 конкретных мотивов, независимо от того, насколько необычное описание даёт пользователь.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google начала тестировать новую reCAPTCHA — пользователей просят показать руки в камеру, и не обязательно свои 19 мин.
ИИ оказался слишком дорогим: компании урезают сотрудникам доступ к ChatGPT и Claude 21 мин.
Студия создателя Deus Ex и System Shock перестанет делать игры — после провала Thick as Thieves в OtherSide осталось меньше десяти человек 44 мин.
Google не смогла отбиться от рекордного штрафа в €4,1 млрд в Европе 52 мин.
Кризис Xbox поставил под угрозу закрытия Obsidian — студию в ответе за Fallout: New Vegas, Pillars of Eternity и South Park: The Stick of Truth 2 ч.
Toyota собирается при помощи ИИ навести порядок в своей документации и терминологии 2 ч.
Некоторые смартфоны Google Pixel перестали издавать звуки, когда на них звонят 3 ч.
В сервисе Apple Hide My Email обнаружена уязвимость, позволяющая раскрыть настоящий адрес почты 3 ч.
Anthropic удалила из Claude скрытую защиту от дистилляции ИИ-моделей китайскими разработчиками 4 ч.
Представлено решение Curator.Scanner для поиска уязвимостей во внешней IT-инфраструктуре 4 ч.
Amazon запустила достаточно спутников для запуска конкурента Starlink 55 мин.
ИИ подрывает экологические цели: выбросы углекислого газа у Amazon подскочили на 16 % в 2025 году 58 мин.
«Яндекс» разрабатывает новые ИИ-устройства — «Пин», «Хронум» и другие загадочные продукты 2 ч.
Инвестиции с кешбэком: NVIDIA вкладывается в создание ИИ-инфраструктуры партнёров в обмен на доход от её эксплуатации 2 ч.
Weave представила бытового робота Isaac 1 — он будет наводить порядок, пока хозяев нету дома 2 ч.
Будущая Xbox Project Helix, вероятно, будет лишена дисковода 3 ч.
В центре Москвы открыли новый флагманский магазин Xiaomi Store 3 ч.
Getty Images отказалась поглощать Shutterstock — помешал британский регулятор 3 ч.
Intel без лишнего шума подняла рекомендованные цены Core Ultra 7 270K Plus и Core Ultra 5 250K Plus 3 ч.
Microsoft сняла с производства бюджетные Surface Go и Surface Laptop Go — вместо них предлагает Dell XPS 13 3 ч.