有没有快速验证13 14代IU硬件稳定性问题的办法?【11/16更新】
本帖最后由 inSeek 于 2024-11-17 12:54 编辑最近几个月,我们时不时接到我们程序崩溃的报告,这些案例的特征都是:
1. 137、139、147、149的K/KF/KS系列CPU
2. 程序崩溃的地方,每次都不一样
3. 系统日志中还有很多其他程序崩溃记录
而我们的程序是基于electron的,所以相比其他程序,更加的单线程负载,所以就更加容易崩。
但对于硬件小白用户来说,这个事情讲不清楚,在他们眼里其他程序没崩或者崩的比你少,那就是你的问题...
所以各位21cm,有啥办法能快速验证13 14代IU硬件稳定性?
---------------------11/16 更新---------------------
7-zip的benchmark好用,decoding环节直接报错。
而R15 FP64之类的都没问题。
让用户锁大核到50x,decoding就不报错了。
这个用户是13600KF + 开了ASUS的增强与XMP其余全默认。 P95 smallFFT
不稳定的会秒崩 n卡反复重装驱动程序(选清洁安装)如果缩了10次以内就不稳报错了 全默认状态50圈R15 先排查内存 archxm 发表于 2024-11-14 19:01
先排查内存
确实是有用户内存超频出的问题,是个AM5平台的用户
但这些事情,让小白用户去做,就真的有难度的 7-zip 跑里面的压缩测试,跑个15-30分钟不报错基本就没问题了 看来是不好割舍的客户,这烂摊子有的收拾了 先上编译着色器试试[偷笑]
认真的,压力测试,prime95 cinebench这些,我记得furmark也有cpu stresser 霜恸 发表于 2024-11-14 20:24
看来是不好割舍的客户,这烂摊子有的收拾了
都是游戏用户,所以好多用的这类CPU。再加上用户不算少,CPU故障概率再小,我们也会遇到一些案例报告。
真的是一头包。 jcd_chh 发表于 2024-11-14 20:29
先上编译着色器试试
认真的,压力测试,prime95 cinebench这些,我记得furmark也有cpu stresser ...
我的设想是,最好是小工具,往用户机器上一拷,运行个几分钟,出个70%置信度的定性结论就好... 最好还不会把电脑跑死机的... 不然弄不好有事情就会怪你头上... 哎
目前看P95可能可以...?
AIDA64的FP64 10圈能跑出问题么? inSeek 发表于 2024-11-14 20:01
确实是有用户内存超频出的问题,是个AM5平台的用户
但这些事情,让小白用户去做,就真的有难度的 ...
现在超频作为噱头,早该管管了,实际 p 用没有,虽略微提升性能,但不稳定。
个装机店老板最喜欢宣传超频来忽悠小白 inSeek 发表于 2024-11-14 20:45
我的设想是,最好是小工具,往用户机器上一拷,运行个几分钟,出个70%置信度的定性结论就好... 最好还不 ...
建议你们官网出教程,然后用户反馈问题,就让客服贴上官网的那个教程,不一定能完全消除,但估计也能解决部分客户的问题。
再就是客户其实也心里没底,需要你们的一个态度 archxm 发表于 2024-11-14 21:03
建议你们官网出教程,然后用户反馈问题,就让客服贴上官网的那个教程,不一定能完全消除,但估计也能解决 ...
有引导的。但用户在RMA之前还是想试试从软件层面解决问题。而且这个崩,并不是所有现象都一样,导致并不能有100%把握源头在CPU,我们遇到现象不一样的就得再查...
而且,这里面有一个尴尬的事情,上头也有提到。因为electron程序的特点,在13 14代CPU上,确实更加容易崩。对于不懂的用户来说,这点比较难解释。尝试过用黑猴子编译着色器的事情来解释,有一丢丢效果。 直接发公告甩锅 Intel 就完事了,为什么要帮它擦屁股[偷笑] Misaka_9993 发表于 2024-11-14 21:09
直接发公告甩锅 Intel 就完事了,为什么要帮它擦屁股
因为研发也没法拍胸脯说自己没写出bug
[生病]
倒是甩过黑猴子的那个公告页面 inSeek 发表于 2024-11-14 21:11
因为研发也没法拍胸脯说自己没写出bug
现在写出系统崩掉的代码,也不容易吧。 看完深感自己投靠amd的决定是正确的 岳耳 发表于 2024-11-14 21:16
现在写出系统崩掉的代码,也不容易吧。
不是弄崩系统... 这些CPU的电脑Win也少有崩,但是系统上面的程序真的崩的五花八门,2天可以崩几十个/次,dwm.exe也崩 让楼上的内存哥帮你的客户换内存( 编译着色器好像可行?
黑猴子那次似乎就是一些人CPU出问题通过首次编译着色器发现的
但是因为自己是7945HX 所以只记得有这么个事
具体型号没注意 inSeek 发表于 2024-11-14 21:07
有引导的。但用户在RMA之前还是想试试从软件层面解决问题。而且这个崩,并不是所有现象都一样,导致并不 ...
你前面不是说是内存超频导致吗?咋又说 RMA 呢?所以到底内存问题,还是 cpu 问题啊 inSeek 发表于 2024-11-14 21:18
不是弄崩系统... 这些CPU的电脑Win也少有崩,但是系统上面的程序真的崩的五花八门,2天可以崩几十个/次, ...
我觉得换个思路,找台老电脑,同样环境下不崩,那么可以确认问题出在电脑硬件上了。
然后再排查硬件,如果主板,内存硬盘都没问题,那就是cpu挂了。 Mashiro_plan_C 发表于 2024-11-14 21:19
让楼上的内存哥帮你的客户换内存(
阴阳怪气 archxm 发表于 2024-11-14 21:21
你前面不是说是内存超频导致吗?咋又说 RMA 呢?所以到底内存问题,还是 cpu 问题啊 ...
最一开始你说到了内存,我表示内存问题引起的确实有... 印象中我自己找用户查的就一例,AM5超频了内存
实际案例中,大多数都是CPU相关引起的... 这类用户因为不是完全不能用,难得崩下都能忍,所以就懒得RMA CPU 隔空排查系统稳定性问题本来就就是不可能任务。
让用户直接找人升级BIOS之后不开启XMP,以确保系统稳定运行。 岳耳 发表于 2024-11-14 21:21
我觉得换个思路,找台老电脑,同样环境下不崩,那么可以确认问题出在电脑硬件上了。
然后再排查硬件,如 ...
崩的多种现象中,有一种是启动软件就崩。这类判断起来就很方便,直接电源管理里,CPU最大频率50%,之后启动就不崩了。这类,基本能确定锅在CPU
我们是一个软件,用户天南地北的。所以你说的换个硬件的办法是大概率做不到的。 ancientplant 发表于 2024-11-14 21:26
隔空排查系统稳定性问题本来就就是不可能任务。
让用户直接找人升级BIOS之后不开启XMP,以确保系统稳定运行 ...
主要还有以讹传讹的,比如,开了你们软件,让我电脑蓝屏了,不开就不蓝(但其实也崩...
你说的是有道理的,遇到这类报告,如果到我这了,我发现有超频,一般都会让对方先还原再说... electron 这个确实很复杂,你可以找一下其他使用electron 的程序,多找几个,问用户有没有安装,如果有安装,是否也和你家程序一样出现类似问题。如果是,那就确实不是你们公司程序的问题。然后,让用户自己排查 cpu 吧,能走售后就走呗。 archxm 发表于 2024-11-14 21:40
electron 这个确实很复杂,你可以找一下其他使用electron 的程序,多找几个,问用户有没有安装,如果有安装 ...
electron官方demo都崩...
[生病]