Сегодня 02 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

GeForce RTX 5090 стали зависать в рабочих станциях — причина не ясна, а помогает только перезагрузка

Видеокарты Nvidia GeForce RTX 5090 и RTX Pro 6000 столкнулись с воспроизводимой ошибкой сброса функции виртуализации, из-за которой графические ускорители могут полностью перестать отвечать до физической перезагрузки хост-системы.

 Источник изображения: Reddit

Источник изображения: Reddit

Компания CloudRift, провайдер облачных вычислений с графическими процессорами, опубликовала подробное описание проблемы, обнаруженной на нескольких системах, оборудованных ускорителями Blackwell. Компания даже объявила о публичной награде в размере $1000 за решение ошибки или обнаружение её первопричины. По данным CloudRift, ошибка возникает после того, как графический процессор был подключён к виртуальной машине с помощью KVM и VFIO. При выключении гостевой системы или переназначении графического процессора хост выполняет сброс на уровне функций PCIe (FLR), что является стандартной процедурой очистки устройства, подключённого к хост-системе. Но вместо того чтобы вернуться в заведомо исправное состояние, графический процессор не отвечает, и появляется ошибка ядра: «не завершено через 65535 мс после FLR; сдаюсь» (not ready 65535ms after FLR; giving up). В этот момент карта также становится нечитаемой для lspci, что приводит к ошибкам «неизвестный тип заголовка 7f». CloudRift отмечает, что единственный способ восстановить нормальную работу — это выключить и снова включить всю систему.

Tiny Corp, стартап в области искусственного интеллекта, разработчик фреймворка tinygrad для глубокого обучения, привлёк внимание к этой проблеме, опубликовав результаты CloudRift на X.com с вопросом: «Есть ли у RTX 5090 и RTX Pro 6000 аппаратный дефект? Мы изучили этот вопрос, но не нашли решения».

Обсуждения на форумах Proxmox и в сообществе Level1Techs свидетельствуют о том, что домашние пользователи и другие владельцы карт RTX 5090 также сталкиваются с похожим поведением. Так, в одном случае пользователь сообщил о полном зависании хоста после выключения гостевой системы Windows, при этом графический процессор не смог повторно инициализироваться даже после перезагрузки ОС. В другом случае пользователь сообщил: «Я обнаружил, что мой хост перестал отвечать. Дальнейшая отладка показала, что процессор хоста был заблокирован после тайм-аута FLR, который произошёл после выключения LinuxVM. С моей предыдущей картой RTX 4080 проблем не возникало».

Несколько пользователей подтвердили, что переключение настроек PCIe ASPM или ACS не устраняет проблему. С видеокартами Nvidia предыдущего поколения, такими как RTX 4090, проблем не наблюдалось, что позволяет предположить, что ошибка может быть связана только с актуальным семейством видеокарт Nvidia Blackwell.

FLR — критически важная функция в конфигурациях сквозного доступа к графическим процессорам, позволяющая безопасно сбрасывать устройство и переназначать его между гостевыми системами. Если в работе FLR есть проблемы, многопользовательские рабочие нагрузки ИИ и домашние лаборатории с использованием виртуализации становятся рискованными, особенно когда сбой одной видеокарты приводит к сбою всего хоста. Nvidia пока официально не признала наличие проблемы, и на момент публикации данной заметки не было известно о способах её решения.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Анонсирован духовный наследник Zeus: Master of Olympus — градостроительная стратегия Theos: Cities of Myth, где переплелись история и мифы 11 мин.
Адская пошаговая ролевая игра Entropy от создателя Dread Delusion получила демоверсию и дату выхода в раннем доступе Steam 46 мин.
Ограничения VPN-трафика затруднили разработку программного обеспечения 2 ч.
Apple научит iPhone разделять совместный счёт в ресторане по фотографии чека 2 ч.
Критические уязвимости обнаружены в 84 % российских мобильных приложений 2 ч.
«Русы против ящеров 2» выйдет на «ящерских консолях» и получит бесплатное дополнение «Русы в Америке» 10 ч.
Тактический шутер Dioxide с элементами Dark Souls отправит в корпоративную антиутопию — трейлер новой игры от авторов Forgive Me Father 11 ч.
«Готовьтесь к следующей битве!»: режиссёр Tekken 7 и Tekken 8 покинул Bandai Namco после 20 лет работы 13 ч.
Вышел первый трейлер «Сатурн. Наследие» — научно-фантастической RPG от бывших разработчиков Baldur’s Gate 3 14 ч.
Процессоры RTX Spark будут нативно поддерживать античитерское и антипиратское ПО для игр 15 ч.
Как карта ляжет, как сеть укажет: AWS внедряет в своих ЦОД квазислучайную сетевую архитектуру RNG 9 мин.
Новая статья: Обзор TWS-наушников realme Buds Air8 Pro: сумма технологий 11 мин.
Глава NASA не верит в возобновление полётов ракеты New Glenn раньше 2028 года — это вычёркивает Blue Origin из лунной гонки 34 мин.
Представлена эталонная ИИ-платформа для робототехники Qualcomm Dragonwing IQ10 41 мин.
Alphabet продаст акций на $80 млрд, чтобы направить средства на развитие инфраструктуры ИИ 45 мин.
Intel предупредила, что путь ПК-чипов Nvidia RTX Spark к успеху не будет гладким 3 ч.
MSI представила портативный игровой компьютер Claw 8 EX AI+ с процессором Intel Arc G3 4 ч.
Anthropic передала американским регуляторам проспект эмиссии, позволяющий начать подготовку к IPO 5 ч.
ИИ-ускоритель Intel Crescent Island получит до 480 Гбайт LPDDR5X 9 ч.
MSI анонсировала тонкий 16-дюймовый ноутбук «2-в-1» Prestige N16 Flip AI+ на чипе Nvidia RTX Spark 9 ч.