Сегодня 05 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

GeForce RTX 5090 стали зависать в рабочих станциях — причина не ясна, а помогает только перезагрузка

Видеокарты Nvidia GeForce RTX 5090 и RTX Pro 6000 столкнулись с воспроизводимой ошибкой сброса функции виртуализации, из-за которой графические ускорители могут полностью перестать отвечать до физической перезагрузки хост-системы.

 Источник изображения: Reddit

Источник изображения: Reddit

Компания CloudRift, провайдер облачных вычислений с графическими процессорами, опубликовала подробное описание проблемы, обнаруженной на нескольких системах, оборудованных ускорителями Blackwell. Компания даже объявила о публичной награде в размере $1000 за решение ошибки или обнаружение её первопричины. По данным CloudRift, ошибка возникает после того, как графический процессор был подключён к виртуальной машине с помощью KVM и VFIO. При выключении гостевой системы или переназначении графического процессора хост выполняет сброс на уровне функций PCIe (FLR), что является стандартной процедурой очистки устройства, подключённого к хост-системе. Но вместо того чтобы вернуться в заведомо исправное состояние, графический процессор не отвечает, и появляется ошибка ядра: «не завершено через 65535 мс после FLR; сдаюсь» (not ready 65535ms after FLR; giving up). В этот момент карта также становится нечитаемой для lspci, что приводит к ошибкам «неизвестный тип заголовка 7f». CloudRift отмечает, что единственный способ восстановить нормальную работу — это выключить и снова включить всю систему.

Tiny Corp, стартап в области искусственного интеллекта, разработчик фреймворка tinygrad для глубокого обучения, привлёк внимание к этой проблеме, опубликовав результаты CloudRift на X.com с вопросом: «Есть ли у RTX 5090 и RTX Pro 6000 аппаратный дефект? Мы изучили этот вопрос, но не нашли решения».

Обсуждения на форумах Proxmox и в сообществе Level1Techs свидетельствуют о том, что домашние пользователи и другие владельцы карт RTX 5090 также сталкиваются с похожим поведением. Так, в одном случае пользователь сообщил о полном зависании хоста после выключения гостевой системы Windows, при этом графический процессор не смог повторно инициализироваться даже после перезагрузки ОС. В другом случае пользователь сообщил: «Я обнаружил, что мой хост перестал отвечать. Дальнейшая отладка показала, что процессор хоста был заблокирован после тайм-аута FLR, который произошёл после выключения LinuxVM. С моей предыдущей картой RTX 4080 проблем не возникало».

Несколько пользователей подтвердили, что переключение настроек PCIe ASPM или ACS не устраняет проблему. С видеокартами Nvidia предыдущего поколения, такими как RTX 4090, проблем не наблюдалось, что позволяет предположить, что ошибка может быть связана только с актуальным семейством видеокарт Nvidia Blackwell.

FLR — критически важная функция в конфигурациях сквозного доступа к графическим процессорам, позволяющая безопасно сбрасывать устройство и переназначать его между гостевыми системами. Если в работе FLR есть проблемы, многопользовательские рабочие нагрузки ИИ и домашние лаборатории с использованием виртуализации становятся рискованными, особенно когда сбой одной видеокарты приводит к сбою всего хоста. Nvidia пока официально не признала наличие проблемы, и на момент публикации данной заметки не было известно о способах её решения.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Anthropic представила Claude Opus 4.6 — флагманскую LLM с командами агентов, миллионным контекстом и платным доступом 12 мин.
«Поэзия от мира пошаговых тактик»: научно-фантастическая стратегия Menace стартовала в раннем доступе Steam с «очень положительными» отзывами 22 мин.
Новый трейлер раскрыл дату выхода научно-фантастического приключения Planet of Lana 2: Children of the Leaf — демоверсия на подходе 3 ч.
Internet Archive взялся лечить интернет от «гниения ссылок» 3 ч.
«То есть Concord вас ничему не научила?»: Sony анонсировала кооперативный боевик Horizon Hunters Gathering, и фанаты в недоумении 4 ч.
The Elder Scrolls IV: Oblivion Remastered выйдет на Nintendo Switch 2, но фанаты радоваться не спешат 5 ч.
Дуров: Telegram ни разу не передал данные из переписок — и никогда этого не сделает 6 ч.
Bethesda подтвердила даты выхода Fallout 4: Anniversary Edition и Indiana Jones and the Great Circle на Nintendo Switch 2 6 ч.
Российский банк впервые начал выдавать кредиты под залог биткоинов 6 ч.
Осенью в Substack произошла утечка данных пользователей — обнаружили её только в феврале 7 ч.
Вложимся в ИИ, а там посмотрим: Alphabet удвоит капзатраты в 2026 году на фоне полуторакратного роста выручки Google Cloud 30 мин.
Образцовая поддержка: Noctua «омолодила» полмиллиона кулеров — даже 17-летняя модель получила крепление под AM5 43 мин.
Топливо с «запахом жареной картошки»: в России успешно испытали авиационный SAF из отработанного растительного масла 3 ч.
ASRock начала проверки после новых поломок Ryzen 9000, но не объяснила, что делать пользователям 3 ч.
MSI усилила защиту RTX 5000 и RX 9000 от плавления разъёма — Afterburner получит функцию GPU Safeguard+ 3 ч.
Intel придумала интегрированные конденсаторы нового поколения — ключ к стабильному питанию ИИ-чипов будущего 5 ч.
Starlink стал золотой жилой SpaceX и скоро расширится — от спутниковых ИИ-гаджетов до контроля орбиты 5 ч.
Оперативная память и SSD подорожают почти вдвое в текущем квартале — как для ПК, так и для серверов 6 ч.
Из-за дефицита памяти у Raspberry Pi 4 появился версия со «сдвоенной» RAM, а 16-Гбайт версия Raspberry Pi 5 существенно подорожала 6 ч.
BMW признала подписку на обогрев сидений перегибом, но не откажется от разблокировки функций за доплату 6 ч.