Сегодня 29 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google создала ИИ для проверки фактов в ответах других ИИ

Компания Google разработала ИИ-систему «оценки фактов на основе поисковой выдачи» (Search-Augmented Factuality Evaluator, SAFE), задача которой находить ошибки в ответах сервисов на базе больших языковых моделей (LLM) вроде ChatGPT.

 Источник изображения: pixabay.com

Источник изображения: pixabay.com

LLM используются в разных целях, вплоть до написания научных работ, однако они нередко ошибаются, приводя недостоверные сведения, и даже настаивая на их истинности («галлюцинируя»). Новая разработка команды Google DeepMind вычленяет из вывода нейросети отдельные факты, формирует запрос к поисковой системе и пытается найти подтверждения изложенных сведений.

 Источник изображения: Google Deepmind

Источник изображения: Google DeepMind

Во время тестирования SAFE проверила 16 тысяч ответов нескольких сервисов на базе больших языковых моделей, среди которых Gemini, ChatGPT, Claude и PaLM-2, после чего исследователи сравнили результаты с выводами людей, занимавшихся этим вручную. Выводы SAFE на 72 % совпали с мнениями людей, причём при анализе расхождений в 76 % истина оказывалась на стороне ИИ.

Код SAFE опубликован на GitHub и доступен всем желающим проверить надёжность ответов LLM.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Благослови богов PlayStation»: Sony обрадовала фанатов анонсом линейки игр PS Plus на август 44 мин.
Windows 10 сегодня исполнилось 10 лет — вспоминаем 10 спорных и определяющих моментов в истории ОС 52 мин.
Photoshop получил ИИ-инструмент для быстрого повышения качества старых фотографий 2 ч.
Судебные документы Sony и Tencent раскрыли актуальные продажи игр серии Horizon 2 ч.
Скоро рынок наполнится наушниками со встроенным ИИ на базе GPT-4.1 — Bragi и OpenAI договорились о партнёрстве 2 ч.
Россияне пожаловались на проблемы с доступом к сайту «Почты России», но ведомство опровергло наличие сбоев 2 ч.
Провал Suicide Squad: Kill the Justice League не остановил Warner Bros. — разработчики Gotham Knights взялись за крупнобюджетную игру-сервис 3 ч.
«Инферит ОС» (ГК Softline) запустила открытое бета-тестирование операционной системы «МСВСфера» 10 3 ч.
Американку осудили на 8,5 лет тюрьмы за помощь северокорейцам в проникновении в компании США 3 ч.
Акции Spotify упали на 8 % из-за обвалившейся выручки и плохих прогнозов 4 ч.
Razer представила киберспортивную беспроводную гарнитуру BlackShark V3 Pro в версиях для ПК, PS5 и Xbox 49 мин.
Стартап Reflect Orbital направит солнечный свет на ночную сторону Земли с помощью гигантских зеркал на орбите 2 ч.
Corsair представила мощный мини-ПК AI Workstation 300 — процессоры Ryzen AI Max и до 128 Гбайт памяти LPDDR5X 2 ч.
Ayaneo анонсировала складную портативную игровую консоль Pocket DS с Android и двумя экранами 2 ч.
Domino's научила робопса Boston Dynamics Spot доставлять пиццу и отгонять чаек 3 ч.
Elgato выпустила Facecam 4K — веб-камеру с поддержкой 4K при 60 FPS и сменными фильтрами за $200 3 ч.
Apple открывает академию в Детройте, чтобы научить малый бизнес умному производству в США 3 ч.
Калибровочные снимки «Джеймса Уэбба» отсеяли кандидатов на роль лёгкой тёмной материи 4 ч.
MaxLinear представила DPU Panther V с пропускной способностью 450 Гбит/с 5 ч.
HMD представила кнопочный телефон Barça 3210 — стиль Nokia, логотип «Барселоны» и поддержку DeepSeek 5 ч.