Сегодня 23 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → надёжность

ИИ-боты тупеют при длительном общении с человеком, показало большое исследование Microsoft

Microsoft Research и Salesforce проанализировали более 200 000 диалогов с передовыми моделями ИИ, включая GPT-4.1, Gemini 2.5 Pro, Claude 3.7 Sonnet, OpenAI o3, DeepSeek R1 и Llama 4. Результаты показали, что все они часто «теряются в разговоре», если он разбивается на естественные многоходовые диалоги с обменом репликами. Для собеседника чат-ботов это выглядит, как постепенное «оглупление» модели, сопровождающееся галлюцинациями и откровенно неверными ответами.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Учёные утверждают, что ИИ-модели, такие как GPT-4.1 и Gemini 2.5 Pro, достигают 90 % точных ответов при обработке отдельных запросов. Однако их производительность падает примерно до 65 % во время более длительных диалогов с обменом многочисленными репликами. Причём модели склонны использовать свой первоначальный ответ в качестве основы для ответа на последующие вопросы, даже если он был неверным.

Исследователи обнаружили ещё одно любопытное явление — раздувание ответов. Ответы и реакции моделей становились на 20‑300 % длиннее при участии в многоходовых диалогах. Более длинные ответы на запросы приводили к большему количеству предположений и иллюзий, которые затем использовались моделями в качестве постоянного контекста в разговоре.

Хотя такие модели, как o3 от OpenAI и DeepSeek R1, обладают дополнительными «токенами мышления», они не смогли выбраться из этой странной ситуации. Исследователи подчеркнули, что надёжность LLM снизилась на 112 %. Это объясняется склонностью моделей к преждевременной генерации — они пытаются предложить ответ на запрос, не дочитав его до конца.

Становится очевидным, что ИИ ещё не достиг своего пика, сталкиваясь с такими критическими проблемами, как низкая надёжность при участии в многоходовых диалогах. Тем не менее, отношение пользователей к ИИ-сервисам быстро меняется, особенно с появлением таких инструментов, как «ИИ-обзоры Google». Следует отметить, что отказ от традиционных поисковых систем в пользу инструментов на основе ИИ — это большой риск, поскольку генерируемая информация может оказаться недостоверной.

Некоторое время назад Microsoft обвинила пользователей в неправильном использовании ИИ, заявив о низком уровне инженерных навыков при разработке подсказок. Возможно, именно глупые вопросы и плохие подсказки от «кожаных мешков» не дают моделям искусственного интеллекта проявить себя во всей красе?

Пользователей флагманских наушников Sony WH-1000XM6 взбудоражила новость о сломавшемся шарнире — от этого массово страдали XM5

Флагманские наушники Sony WH-1000XM6 появились в продаже всего два месяца назад, но в Сети уже начинают появляться тревожные отзывы первых покупателей, вызывающие опасения по поводу их долговечности — у наушников стали ломаться шарниры. Примечательно, что проблема преследовала предыдущую модель наушников Sony WH-1000XM5 и поклонники бренда надеялись, что она осталась в прошлом.

 Источник изображения: Red Note

Источник изображения: Red Note

Опубликованный на форуме Reddit пост сообщает о, возможно, первом зарегистрированном случае поломки шарнира в районе оголовья у WH-1000XM6. Многие владельцы модели XM5 помнят это место, как ахиллесову пяту наушников. Первоисточником публикации о поломке новых наушников WH-1000XM6 стала китайская платформа Red Note. Владелец наушников опубликовал фотографии со сломанным шарниром и клятвенно заявил, что обращался с наушниками «аккуратно».

Это важный инцидент, поскольку в модели XM6 должна была быть решена именно эта проблема. По данным сайта SoundGuys, Sony полностью переработала шарнир в новой модели, встроив металлический компонент в пластиковый корпус и вернув складной механизм для компактного хранения. XM5 имели более плоскую конструкцию без складного оголовья и столкнулись с таким количеством поломок, что 25 % опрошенных читателей SoundGuys заявили, что у них сломался шарнир. Даже с учётом не самой репрезентативной выборки такая статистика всё равно вызывает беспокойство.

Пока рано говорить, является ли случай с моделью XM6 единичным или это начало другой распространённой проблемы с надёжностью. В конце концов, устройства всегда будут ломаться. Кроме того, нельзя с уверенностью сказать, что владелец наушников действительно обращался с ними бережно. Тем не менее, даже одного сообщения о такой поломке оказалось достаточно, чтобы заставить понервничать некоторых пользователей Reddit, участвующих в обсуждении, особенно учитывая цену наушников в $450 и не самую лучшую репутацию Sony в плане надёжности шарниров.

Sony WH-1000XM6 рассматривались как модель, призванная решить проблемы прежней модели. В обзоре SoundGuys наушники хвалили за качественный звук, отличное шумоподавление и значительный шаг вперёд по сравнению с XM5 по большинству показателей. Если шарнир снова окажется слабым местом новой модели, это может подорвать усилия Sony. Тем не менее, специалисты iFixit уже высоко оценили ремонтопригодность новых наушников Sony.

У электромобилей по-прежнему большие проблемы с качеством — большинство проблем из-за ПО

Одним из главных преимуществ электромобилей провозглашается простота их обслуживания по сравнению с традиционными автомобилями с ДВС — никаких замен масла, проще трансмиссия, меньше движущихся частей. Однако последнее исследование качества, проведённое компанией JD Power, показывает электромобили далеко не в лучшем свете. Электрокары и гибриды уступили свои бензиновым собратьям практически во всех категориях ремонта, изученных JD Power.

 Источник изображения: freepik.com

Источник изображения: freepik.com

JD Power оценивает качество автомобилей на основе количества зарегистрированных проблем на 100 автомобилей определённой марки. У автомобилей с ДВС выявлено 180 проблем на 100 автомобилей, а у электромобилей — 266. В большинстве своём проблемы не имели ничего общего с механикой и почти полностью были связаны с технологиями.

«Владельцы новейших, высокотехнологичных электромобилей и гибридных автомобилей сталкиваются с проблемами, которые вынуждают их обращаться в дилерский центр в три раза чаще, чем владельцы автомобилей, работающих на бензине», — заявил директор по автомобильному тестированию JD Power Фрэнк Хэнли (Fan Hanley).

 Источник изображения: JD Power

Источник изображения: JD Power

Исследователи JD Power отмечают, что раньше Tesla демонстрировала лучшие результаты, чем электромобили других автопроизводителей. Но теперь этот разрыв сократился, и рейтинг компании сравнялся с остальными. JD Power связывает это с серьёзными изменениями в конструкции Tesla и отказом от традиционных элементов управления, таких как указатели поворота и переключатели стеклоочистителей.

Людей раздражают ложные предупреждения, а также неточные и навязчивые оповещения от систем помощи водителю, особенно в отношении таких функций, как предупреждения о перекрёстном движении и автоматическое экстренное торможение. Сенсорные экраны информационно-развлекательных систем вызывают у людей головную боль. У электромобилей было на 30 % больше проблем в категории «Функции, органы управления и дисплеи», чем у автомобилей с ДВС.

«Клиенты чаще всего испытывают трудности с подключением [своих телефонов] к автомобилю или с потерей соединения, — сообщает JD Power. — Более 50 % пользователей Apple и 42 % пользователей Samsung получают доступ к соответствующей функции каждый раз, когда едут, что свидетельствует о том, что клиенты хотят, чтобы их смартфон был перенесён в автомобиль, а также хотят, чтобы эта функция была интегрирована по беспроводной сети».

Неудивительно, что покупатели возвращаются и голосуют кошельком за бренды, у которых выявлено меньше проблем. Наиболее лояльными являются владельцы пикапов, а первое место — у Ram.

Мир переживает массовый переход от традиционных автомобилей с ДВС к «гаджетам на колёсах». Этот переход оказался далеко не так прост, как виделось несколько лет назад. В эпоху революционных автомобильных перемен страдают прежде всего любители инноваций, которые прокладывают путь остальным.


window-new
Soft
Hard
Тренды 🔥
Samsung улучшит ИИ-функции Galaxy AI за счёт партнёрства с Perplexity 19 ч.
AMD прекратила выпускать обновления драйверов для Ryzen Z1 Extreme 19 ч.
Активисты Stop Killing Games будут «кошмарить» издателей за закрытие старых игр на юридической основе 20 ч.
Новая статья: Reanimal — мастер-класс, но не без изъянов. Рецензия 22-02 00:09
Не только Cyberpunk 2077: на мощных Android-устройствах заработали AAA-игры для ПК, но с ограничениями 21-02 16:59
Apple создаёт локального ИИ-агента для iPhone, который сможет управлять приложениями за пользователя 21-02 13:50
Roblox обеспечила больше роста игровой индустрии, чем Steam, PlayStation и Fortnite вместе взятые 21-02 13:43
Платные подписчики YouTube Music начали слышать рекламу — Google пообещала разобраться 21-02 12:32
Microsoft: смена руководства в Xbox не повлечёт сокращений и закрытия студий 21-02 10:55
WhatsApp научится скрывать сообщения под спойлеры — прямо как другой популярный мессенджер 21-02 10:53