P44Pro出现掉盘现象,疑似win11和solidigm的nvme驱动再次出现兼容性问题
本帖最后由 PPXG 于 2023-9-9 19:07 编辑整机配置:
13600K
吹雪Z790-A
VK GL360上置出风
宏碁炫光星舰 6800C34 16x2
TUF 4090
AMP1000
追风者P500A
此外有四把利民C14S 前3进 后1出 构建风道
系统盘为P44Pro 2TB,618活动首日购于京东solidigm旗舰店(当时看错活动了 买成了非自营[困惑] ),安装在吹雪最靠近CPU的第一根直连4.0 x4 m2插槽,使用主板自带导热垫和散热马甲,除机箱风道外无其他辅助主动散热措施
第一次掉盘发生在9月2日约凌晨0点38分,电脑在挂机星铁直播,整机无明显高功耗硬件,CPU 显卡均轻载,注意到屏幕画面不动时电脑晃动锁死无任何反应,键盘大小写切换无效,但未蓝屏,按下机箱reboot键重启电脑,风扇保持高转且数分钟一直无法通过自检。随后长按电源键断电并再次开机,BIOS进入安全模式,F1进入查看存储信息,m2硬盘均能能识别遂直接退出BIOS顺利进入系统。
因为以前经历过多次类似的场景所以第一时间怀疑出现掉盘,事件查看器也没有记录到任何bugcheck项目,但是P44Pro查看smart一切正常。
第二次掉盘出现在当天晚上9点多,和朋友开黑打彩六时选人结束读图时我的头像上突然出现代表正在载入的沙漏(通常使用低性能硬盘如HDD玩彩六的人才会在读图时出现这个),很巧的是当时刚好后台开着任务管理器,于是切出来看到P44Pro已经持续了数秒的100%,可能因为硬盘已经掉了,点击该选项卡任务管理器也跟着卡死。
此时QQ电话还能正常工作,几十秒之后朋友告诉我游戏掉了,而我的游戏和任务管理器已经永远卡在这个界面了[偷笑] 。又过了一回儿出现蓝屏,代码UNEXPECTED_STORE_EXCEPTION。由于事先未修改默认的蓝屏dmp存放路径,一直卡在0%,于是再度重启,依然是直接重启卡自检,必须长按断点关机再开机。
重启之后我做了什么:
首先事件查看器,不出所料的除了检测到意外关机之外依然没有bugcheck记录。顺便修改了下dmp文件存放位置到一个其他硬盘的固定路径,希望下次出现类似的情况时能有dmp文件分析吧。
优先怀疑硬盘过热导致,虽然玩彩六时显卡功耗不超过300W,但是由于硬盘本身为有缓盘温度天生偏高+主板自带马甲散热有限+一直在吃显卡尾气+朋友提到部分硬盘传感器回报温度可能低于实际某些部件的温度(他在某些SSD上用外置探头测试出过这种现象),确实可能存在这种可能性
这块P44Pro开机稳定后的温度一般在55℃上下(与此同时从盘之一P41Plus仅为约41℃),在游戏时被显卡加热很容易出现接近60℃的高温。但是以前在显卡满载400W+时却从未出现过掉盘情况又在否认这个可能性。随后进行了两个测试:使用solidigm的工具箱运行全面诊断扫描(这个扫描压力还挺大的,硬盘温度明显更高),于此同时继续玩彩虹六号,此时硬盘软件显示全程温度保持在60-62℃,持续一个多小时未出现掉盘现象。之后朋友提到可能硬盘温度传感器数据不全面,于是运行了朋友的fio写入测试脚本施加更大的压力,但是测试完之后分析了下硬盘的性能,朋友没有看出因为过热出现的性能下降,或许可以排除这个可能性。
随后怀疑solidigm的nvme控制器驱动。这个驱动按照solidigm的说法是可以提高P41Plus的存取性能所以我一直装着。该驱动安装后在每次开机时都会导致一个驱动器错误日志,但是在我的新电脑上并没有出现掉盘问题所以没有卸载过(在5800X+TUF B550M的旧平台上这个驱动会导致系统盘海盗船MP600Pro随机掉盘卡死 ),于是卸载了solidigm的nvme控制器驱动和solidigm工具箱软件观察。
截止到今天已经过去七天了,在卸载掉这个驱动之后确实没再出现掉盘,于是分享出来,如果坛友有遇到类似的问题可以尝试卸载solidigm的这个驱动看看。问了朋友他怀疑是Windows和solidigm软件的奇怪兼容性问题,而且这个问题随时可能因为Windows的各种热更新再度出现或者消失,想稳妥的方法就是不要安装这个东西,唯一缺点就是P41Plus的鸡血没了。
如果之后再次出现掉盘再更新[偷笑] 到那时或许就得考虑RMA了 我还好只是闪退,不过有好几次重启不能进系统 还只是副盘 笔记本139HX主副盘都是p44没遇到啥问题 他那個驅動本來就有問題
win10也是這樣
工具箱軟件是沒有問題的
不要裝驅動就可以 solidigm工具箱提供的2.0版驱动已经有几个掉盘案例了,没必要装工具箱,用官网上提供的1.0版纯驱动文件就好 巨硬的阿三跟牙膏的阿三犯冲[狂笑] 啊对对对 发表于 2023-9-9 19:42
solidigm工具箱提供的2.0版驱动已经有几个掉盘案例了,没必要装工具箱,用官网上提供的1.0版纯驱动文件就好 ...
话说上市这么久了,驱动和固件为什么还不出更新……[困惑] sun1a2b3c4d 发表于 2023-9-9 22:09
话说上市这么久了,驱动和固件为什么还不出更新……
我还在等那个固定缓存不释放的功能呢。估计是不会更新了 用的是1.0的驱动还是2.0的驱动?
好像2.0出来后就有掉盘的消息了
我用的1.0,暂时还没遇到问题 我不装驱动,好像暂时还好 aibo 发表于 2023-9-9 22:17
用的是1.0的驱动还是2.0的驱动?
好像2.0出来后就有掉盘的消息了
2.0驱动会报nvme控制器错误,1.0反而没问题 你这温度绝对太高了开机五十几度,我这笔记本上才 42 度,先做好散热吧 aibo 发表于 2023-9-9 22:17
用的是1.0的驱动还是2.0的驱动?
好像2.0出来后就有掉盘的消息了
2.0的,1.0的我记得好像不支持P41Plus那个鸡血来着所以装的2.0 g7muik 发表于 2023-9-9 23:47
你这温度绝对太高了开机五十几度,我这笔记本上才 42 度,先做好散热吧
不是开机,是温度稳定后,刚开机也是40出头 solidigm不熟 但它前身intel的nvme驱动导致蓝屏和掉盘的例子可不少
微软自带标准nvm express控制器驱动可保平安 为什么我装了一切正常[雷人] 我也是p44pro 2t系统盘,win11,默认驱动,没装过什么驱动,暂时没问题 hlhaidy 发表于 2023-9-10 11:12
为什么我装了一切正常
我的在这之前用了连续三个月也是屁事没有[雷人] nepdaisuki 发表于 2023-9-10 11:13
我也是p44pro 2t系统盘,win11,默认驱动,没装过什么驱动,暂时没问题
一样,但后来看到坛里说会掉盘,就把系统转到SATA的860EVO上了,440只做数据盘,目前一切正常 PPXG 发表于 2023-9-10 11:54
我的在这之前用了连续三个月也是屁事没有
618买的到现在没事win11最新正式版 3块P44 Pro,两块插在Z690刀锋钛上的非系统盘用2.0 NVME驱动一直没碰到问题,剩下一块插在NUC X15上做系统盘,正常关机重启经常会触发磁盘自检,检查了一下系统日志发现提示上一次关机是意外的,可我每次都是正常关机的。后来经过排查发现是2.0 NVME驱动的问题,换成系统自带的驱动就正常了。感觉这个盘做系统盘装Solidigm的2.0驱动很容易出问题。 2.0驱动会爆raid错误确实很频繁,但是问题没有遇到过 我认为是12/13代配套Z系列主板的锅,你要是放到AMD主板上估计就没这事了 1.0表示没问题 我也一样,我报告给官方技术支持团队过去了2个月的时间,上周告诉我说他们测试没有复现我描述的问题,然后我问了一下测试环境,竟然使用的win10,我也是无语了。竟然连最基本的操作系统都不一样,那测试下来有什么意义呢。现在他们又开始重新测试了,我还在继续等待解决方案。 2535451yijie 发表于 2023-9-10 16:05
我认为是12/13代配套Z系列主板的锅,你要是放到AMD主板上估计就没这事了
老平台就是AMD照样掉盘 三星980pro也掉过一次盘,直接reset进bios看不到盘。强制关机,拔电源后重新通电开机进bios,能看到硬盘了。进系统也正常。
后续还是买了块sata的ssd当系统盘,980pro当从盘挂在里面用了,各种下载,疯狂写盘用了半年也没掉过盘。
所以有些老人说的,系统盘用sata盘是有道理的 KazamiKazuki 发表于 2023-9-9 22:14
我还在等那个固定缓存不释放的功能呢。估计是不会更新了
不可能不更新吧?就是来的慢一些。看海力士业绩不错,没道理维护不跟上。 windows自带nvme驱动就是最好的
什么三星什么intel,都别装