Сегодня 26 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Твиты нейросети GPT-3 оказались более убедительными, чем посты реальных людей

Судя по результатам исследования, проведённого учёными Института биомедицинской этики и истории медицины в составе Университета Цюриха в Швейцарии, твиты, созданные большой языковой моделью GPT-3 компании OpenAI, оказались убедительнее, чем посты настоящих людей. При этом GPT-3 — это далеко не самая современная версия модели.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Авторы исследования попросили участников опроса отличить твиты, написанные людьми, от сгенерированных ИИ. Кроме того, необходимо было решить, верна ли та или иная опубликованная информация, в том числе контент, связанный с вызывающими споры темами вроде эффективности вакцин и климатических изменений, часто используемых для массовых манипуляций общественным мнением в Сети.

Оказалось, что дезинформацию труднее выявить, если она написана ботами. При этом как это ни парадоксально, достоверную информацию, написанную ботами, легче распознавать. Другими словами, люди, участвовавшие в исследовании, охотнее верили ИИ, чем другим людям, независимо от того, насколько точными на самом деле были сведения — это свидетельствует о том, каким опасным могут стать языковые модели при их использовании для дезинформации.

Исследователи выбрали 11 научных тем, обсуждавшихся в Twitter, включая тему вакцин и COVID-19, климатические изменения и теорию эволюции, после чего поставили GPT-3 задачу создавать посты с верной или ложной информацией. После этого были опрошены более 600 англоговорящих респондентов из США, Великобритании, Канады, Австралии и Ирландии — созданный GPT-3 контент оказался неотличимым от созданного людьми. При этом сами исследователи не были на 100 % уверены в том, что «органический» контент, собранный из социальной сети для сравнения, не был написан сервисами вроде ChatGPT. Кроме того, участникам опроса предлагалось оценивать посты «вне контекста» — они не видели профиля автора, что, возможно, помогло бы им сделать верный вывод, поскольку даже прошлые посты в ленте аккаунта и изображение в профиле могут дать подсказку о его природе.

Успешнее всего участники могли отличать дезинформацию, написанную реальными пользователями Twitter, а GPT-3 убеждала пользователей несколько эффективнее. Стоит помнить, что уже существуют как минимум модели GPT-3.5 и GPT-4, которые справляются с разнообразными задачами ещё лучше. При этом оказалось, что GPT-3 хуже справляется с оценкой твитов, чем люди, по крайней мере, в некоторых случаях. Так, при выявлении верной информации в постах GPT-3 показал себя хуже, чем люди, а при обнаружении дезинформации ИИ и люди справлялись примерно одинаково.

Возможно, дальнейшее совершенствование механизмов безопасности языковых моделей помешает создавать вредоносный контент с их помощью. Так, GPT-3 иногда отказывалась генерировать недостоверные материалы по заданию учёных, в частности, о вакцинах и аутизме. Вероятно, дело в том, что при тренировке использовалось много данных, посвящённых разоблачению конспирологических теорий. Впрочем, по мнению исследователей, лучшим инструментом распознавания ложной информации пока по-прежнему остаётся человеческие здравый смысл и критическое отношение к любой предлагаемой информации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Редактор модов Zone Kit для S.T.A.L.K.E.R. 2: Heart of Chornobyl требует 659 гигабайт для установки — GSC объяснила аномалию 4 ч.
Вдохновлённое Disco Elysium мистическое приключение Pera Coda отправит исследовать сюрреалистический Стамбул и глубины собственной психики 6 ч.
Google представила Chrome 138 с новыми ИИ-функциями, исправлениями уязвимостей и синхронизацией групп вкладок 7 ч.
Живой мир, больше разнообразия и ещё несколько лет до релиза: основатель Mundfish поделился новыми подробностями Atomic Heart 2 7 ч.
Audi и Mercedes-Benz отказались от платформы Apple CarPlay Ultra, но обычный CarPlay оставят 8 ч.
Xbox подтвердила дату выхода Senua's Saga: Hellblade II на PS5 и анонсировала улучшения для игры на PC и Xbox 9 ч.
Chrome для Android наконец научился переносить адресную строку в нижнюю часть экрана 9 ч.
Nvidia завершила бета-тестирование DLSS Transformer — с ней игры пойдут в 4K и 240 FPS 9 ч.
Diablo IV возглавила июльскую подборку игр для подписчиков PS Plus, а Sony готовится к празднику 10 ч.
HPE делает ставку на повсеместное использование ИИ-агентов 10 ч.
Новая статья: Обзор игрового ноутбука ASUS ROG Strix SCAR 18 G835 (2025): на что способна мобильная GeForce RTX 5090 2 ч.
Смартфон Трампа передумал быть американским — из описания исчезло гордое «Сделано в США» 2 ч.
Новая статья: Обзор смартфона HUAWEI nova Y63: еще раз в ту же реку 3 ч.
Samsung выпустила 32-дюймовые умные мониторы Smart Monitor M9, M8 и M7 с Tizen OS и частотой до 165 Гц 3 ч.
Philips представила 27-дюймовый IPS-монитор Evnia 27M2N3501PA с разрешением 1440p и частотой до 260 Гц 4 ч.
Huawei представит флагманы Pura 80 на международном рынке раньше, чем ожидалось 5 ч.
Asus анонсировала GeForce RTX 5050 Prime и RTX 5050 Dual с заводским разгоном и без 5 ч.
Samsung не рассчитывает на оглушительный успех XR-гарнитуры Project Moohan на старте продаж 5 ч.
Vivo представила беспроводные наушники TWS Air3 Pro с мощным шумоподавлением и автономностью до 52 часов 5 ч.
Toshiba создала литиевые аккумуляторы, которые заряжается до 80 % за 6 минут и выдерживает 20 000 циклов 5 ч.