Сегодня 13 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ обманул сам себя: ChatGPT, Gemini и Grok провалили тест на распознавание видео от Sora

Ведущие чат-боты с искусственным интеллектом не сумели определить, были ли загруженные в них видео созданы генератором OpenAI Sora — с этим не справился даже ChatGPT от самой OpenAI. Соответствующее тестирование провели специалисты NewsGuard.

 Источник изображения: Solen Feyissa / unsplash.com

Источник изображения: Solen Feyissa / unsplash.com

Генератор видео OpenAI Sora быстро приобрёл репутацию сервиса, способного обманывать людей и заставлять их верить в реальность создаваемых ИИ видео — он может обманывать и другие сервисы ИИ. Лишённое водяных знаков видео Sora не смогли определить xAI Grok (95 % неправильных ответов), OpenAI ChatGPT (92,5 %) и Google Gemini (78 %). Примечателен, конечно, плачевный результат ChatGPT как продукта того же разработчика. Гарантией правильного ответа не стали даже водяные знаки: Grok не распознал созданные ИИ видео в 30 % случаев, ChatGPT — в 7,5 %.

OpenAI помечает видео Sora видимыми водяными знаками, но уже появились бесплатные веб-сервисы по их удалению. Авторы NewsGuard подвергли этой процедуре 20 роликов и загрузили их в переписку с чат-ботами — как с водяными знаками, так и без них. Grok не смог дать правильный ответ в 95 % случаев (38 роликов из 40), ChatGPT — в 92,5 % (37 из 40), а Gemini — в 78 % (31 из 40). ChatGPT и Gemini не отреагировали на созданное ИИ видео задержания подростка миграционной службой — чат-боты заявили, что сцена либо соответствует, либо подтверждена «новостными источниками», а инцидент произошёл на границе США с Мексикой. Подлинность созданного ИИ видео чат-боты подтвердили и в сцене, где сотрудник авиакомпании якобы высаживает с борта самолёта пассажира за кепку с политическим лозунгом.

Наличие водяных знаков существенно улучшило показатели. Grok один раз в своеобразной манере заявил, что видео принадлежит новостному агентству Sora News, которое в действительности не существует. Но в большинстве случаев ChatGPT, Gemini и Grok указали на водяной знак как на доказательство подделки, а также увидели дополнительные признаки работы ИИ — искажения и неестественное освещение. Наличие водяного знака также побуждало чат-ботов более тщательно проверять факты.

Google Gemini — единственный из протестированных чат-ботов, для которого разработчик заложил функцию обнаружения ИИ-контента, созданного моделью Nano Banana Pro той же компании. С видео от Sora чат-бот справился слабо, но при загрузке роликов Nano Banana Pro результаты были значительно лучше — даже без водяных знаков ответ был верным в пяти из пяти случаев. Способность Grok и ChatGPT распознавать собственный контент авторы исследования не проверяли — xAI и OpenAI о такой возможности и не заявляли.

Сервисы ИИ обычно не склонны признавать свои неверные ответы, и тесты NewsGuard это подтвердили: ChatGPT, Gemini и Grok в 2,5 %, 10 % и 13 % случаев соответственно заявили, что не смогут провести такой анализ. Но чаще это были ошибки одного вида — ответ, что созданное ИИ видео было подлинным. В Google напомнили, что генерируемые ИИ-сервисами компании видео получают маркировку по стандарту SynthID; представитель OpenAI прямо заявил, что ChatGPT не имеет возможности отличать ИИ-видео от настоящего; в xAI комментариев не предоставили.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
OpenAI выпустила GPT-5.3-Codex-Spark — свою первую ИИ-модель, работающую без чипов Nvidia 4 ч.
Можно ли клонировать Gemini, завалив её запросами? Google раскрыла мощную дистилляционную атаку 5 ч.
Несмотря на 10 месяцев молчания, мультиплеерный боевик The Duskbloods от создателей Bloodborne и Elden Ring всё ещё запланирован на 2026 год 6 ч.
«Те же щи, да пожиже»: 19 минут геймплея шпионской ролевой игры Zero Parades: For Dead Spies в духе Disco Elysium не впечатлили фанатов 8 ч.
Амбициозный симулятор выживания Blackfrost: The Long Dark 2 не выйдет в 2026 году — разработчики несут потери 8 ч.
Google научит Chrome запускаться вместе с Windows — сразу с открытым окном 9 ч.
Илон Маск сообщил о скором запуске X Money — сервиса, «где будут храниться все деньги» пользователей X 9 ч.
Сайт-двойник 7-Zip десять дней заражал пользователей — вредонос подменял ссылки с задержкой 9 ч.
В Steam вышла демоверсия «Былины» — грандиозной экшен-RPG в мире славянских мифов 10 ч.
Владелец TikTok выпустил ИИ-модель Seedance 2.0 для генерации видео — она стала вирусной 10 ч.
Новая статья: «Железо» эпохи Си 4 ч.
Наскоро построенные ИИ ЦОД могут оказаться не нужны, предупредила китайская SMIC 4 ч.
В ядре Земли нашли водорода на 45 океанов — гипотеза кометного происхождения воды под вопросом 5 ч.
Sony представила флагманские TWS-наушники WF-1000XM6 с улучшенным шумоподавлением за $330 5 ч.
Обещанного два года ждут: Google наконец выпустила приложение YouTube для Apple Vision Pro 7 ч.
Триумф AMD: Ryzen захватили больше 36 % рынка CPU для настольных ПК, пока Intel теряет позиции по всем направлениям 7 ч.
Кризис памяти разогнал продажи ПК — бизнес закупается, пока не стало ещё дороже 9 ч.
InWin представила панорамный компьютерный корпус W50 с геометрическим дизайном 9 ч.
Заказы на газовые турбины Siemens бьют рекорды — причина кроется в ненасытности ИИ 9 ч.
Samsung представила пятислойные матрицы QD-OLED Penta Tandem — вдвое долговечнее и с яркостью до 4500 кд/м² 10 ч.