Сегодня 28 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Исследователи подсчитали количество ложных ответов в Google ИИ-обзорах

Журналисты The New York Times совместно со стартапом Oumi, проанализировав работу функция Google ИИ-обзоры (AI Overviews), пришли к выводу, что нейросеть ежедневно генерирует десятки миллионов ошибочных ответов, несмотря на высокий процент общей достоверности выдаваемых данных. Искусственный интеллект ошибается примерно в 10 % случаев, непреднамеренно выдавая пользователям ложную информацию.

 Источник изображения: AI

Источник изображения: AI

Для оценки достоверности использовался тест SimpleQA, разработанный в 2024 году компанией OpenAI и включающий более 4000 вопросов с проверяемыми фактами. Предыдущая версия ИИ-модели Gemini 2.5 справлялась с тестом на 85 %, а после недавнего обновления до Gemini 3 точность возросла до 91 %. Тем не менее, учитывая гигантские объёмы поискового трафика Google, такая погрешность означает сотни тысяч неверных ответов каждую минуту. Среди выявленных ошибок зафиксирована путаница с датой превращения дома Боба Марли (Bob Marley) в музей, а также отрицание существования Зала славы классической музыки — почётного списка композиторов и исполнителей, учрежденного журналом Gramophone, — куда ранее был включен музыкант Йо-Йо Ма (Yo Yo Ma).

Представитель Google Нед Эдрианс (Ned Adriance), в свою очередь, подверг результаты исследования критике. Он заявил, что тест SimpleQA содержит некорректную информацию и не отражает того, что люди на самом деле ищут в Google. По его словам, компания предпочитает использовать для оценки более проверенную версию бенчмарка под названием SimpleQA Verified. Кроме того, для обеспечения высокой скорости загрузки ответов на странице поиска Google чаще всего используется более быстрая модель Gemini Flash, а не самая точная Gemini 3.1 Pro.

Оценка новых ИИ-моделей осложняется их недетерминированной природой: нейросеть может дать верный ответ на фактический вопрос, а при немедленном повторном запросе — ошибиться. При этом собственные тесты Google для базовых моделей (без доступа к данным из интернета) показывают точность в диапазоне от 60 до 80 %. По этой причине компания сопровождает все ИИ-ответы предупреждением о том, что искусственный интеллект может ошибаться, призывая проверять информацию.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Блокировки разогнали интерес россиян к VPN — число скачиваний VPN-приложений подскочило в 14 раз 48 мин.
Игры на PS4 и PS5 перестанут запускаться без интернета — Sony повторяет ошибку, за которую 13 лет назад высмеивала Microsoft 2 ч.
«Сбер» представил ИИ-генератор картинок Kandinsky 6 Image — он умеет восстанавливать фото и не только 2 ч.
Google превратила поиск на YouTube в диалог с ИИ — но он ошибается 2 ч.
OpenAI опубликовала новые «основополагающие принципы» — они заметно изменились с 2018 года 3 ч.
Это нормально: Ubisoft отреагировала на слухи о сокращении команды Assassin’s Creed Codename Hexe 4 ч.
Meta начала отменять итоги сделки с Manus, стремясь избежать штрафов в Китае 6 ч.
«Превед, медвед!» — и прощай: легендарный сайт Udaff.com закрылся спустя четверть века 8 ч.
Более 600 сотрудников Google выступили против использования фирменного ИИ Пентагоном 8 ч.
ЕС требует от Google впустить конкурентов в Android — доминирование Gemini под ударом 9 ч.
Дефицит полупроводников довёл до подорожания автопилота в Китае — BYD поднимает цены на 20 % 20 мин.
Человекоподобные роботы устроились грузчиками в аэропорт Токио 25 мин.
Logitech представила G512 X — игровую клавиатуру с механическими и аналоговыми свитчами 34 мин.
Россияне стали чаще покупать электронику за границей — и выбирают что подешевле 39 мин.
Tesla согласилась передать Маску многострадальные 300 млн акций за работу в 2018 году — сейчас пакет стоит вдвое дороже 43 мин.
Meta рассчитывает снабжать свои ИИ ЦОД энергией с орбиты 60 мин.
«Прогресс МС-34» успешно доставил на МКС воду, воздух и новый скафандр 60 мин.
NASA отложила Artemis III на конец 2027 года — нерасторопность SpaceX и Blue Origin затягивает полёт на Луну 2 ч.
Google разрешила военным США использовать свой ИИ для «любых предусмотренных законом целей» 2 ч.
Valve отложила запуск Steam Machine и Steam Frame из-за дефицита памяти 3 ч.