据外媒wccftech消息,nvidia的rtx 5090与rtx pro 6000显卡在上月初被曝出存在一个可重复触发的虚拟化重置漏洞。该问题会导致显卡在特定操作下彻底失去响应,唯有通过物理重启主机系统才能恢复正常。
作为GPU云服务提供商的CloudRift,在其多个搭载Blackwell架构芯片的生产系统中遭遇了此问题。随后,该公司发布了一份详尽的分析报告,并宣布设立1000美元悬赏,公开招募能够定位该问题根源或提出有效解决方案的技术人员。

根据CloudRift提供的日志信息,该漏洞出现在GPU通过KVM和VFIO技术透传至虚拟机之后。当虚拟机关闭或GPU资源重新分配时,主机将触发PCIe功能级重置(FLR)。然而,与正常行为不符的是,GPU并未成功复位,反而陷入无响应状态,系统内核会记录:“FLR后65535毫秒仍未就绪;放弃。”
此时,显卡设备对lspci命令完全不可见,并报出“未知头部类型7f”的错误提示。CloudRift强调,目前唯一可行的恢复方式是对整台设备进行断电并重新上电。

AI领域初创企业Tiny Corp也成功复现了这一现象,并公开质疑:“RTX 5090和RTX PRO 6000是否存在硬件缺陷?”该公司表示已进行深入排查,但尚未找到根本解决办法。
在相关技术社区的讨论中,不少个人用户及RTX 5090的早期使用者也反馈了类似情况。有用户指出,在关闭运行中的Windows虚拟机后,主机系统直接卡死,即使执行操作系统级别的重启,GPU仍无法重新初始化。
进一步验证显示,调整PCIe ASPM或ACS等底层设置均无法避免故障发生。截至目前,并未发现上一代显卡(如RTX 4090)出现相同问题,因此推测该漏洞可能仅影响NVIDIA的Blackwell架构产品线。

以上就是RTX 5090遇诡异Bug完全无响应!GPU云服务提供商悬赏1000美元寻解决方案的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号