找回密码
 加入我们
搜索
      
查看: 14660|回复: 66

[CPU] Gamers Nexus发布AMD7000系处理器烧毁测试第一期视频

[复制链接]
发表于 2023-4-30 13:17 | 显示全部楼层 |阅读模式
本帖最后由 KingLu 于 2023-5-3 16:48 编辑

更新了华硕1410版的测试版BIOS,SOC电压下降了0.1V左右,之前是1.3XV,现在是1.2XV。

内存依然开启了EXPO,6000C30也没什么问题。

1410BETA

QQ截图20230503164712.png

1101正式版

QQ截图20230425195908.png



地址:https://www.youtube.com/watch?v=kiTngvvD5dI

省流总结:

  • 他们重现了处理器被烧毁的事件
  • 不仅是SoC电压过高导致的问题
  • 这次测试他们杀死了两颗7800X3D以及一块华硕主板
  • 他们已经将故障零件发送给之前帮他们测试12VHPWR供电烧毁问题的实验室进行测试,需要几周时间



视频中展示了GN和AMD团队关于此次事件的往来邮件,其中一封AMD于4月27日回复GN的邮件如下,省流总结:请更新最新版本的BIOS。

QQ截图20230430132219.jpg
发表于 2023-4-30 13:19 | 显示全部楼层
有没有大佬看完视频解读推测一下到底是为啥烧得。
发表于 2023-4-30 13:20 | 显示全部楼层
看看有没有复现过程预防一下
 楼主| 发表于 2023-4-30 13:28 | 显示全部楼层
ShireCiel 发表于 2023-4-30 13:19
有没有大佬看完视频解读推测一下到底是为啥烧得。
These are complex issues with functionally infinite variables between users (and possible error), manufacturers, BIOS versions, and AMD itself. As such, we can only speak to our findings in some instances -- but we have some that do point to specific issues.


关于烧毁问题,GN当前给出的答复如上,简单来讲就是在用户、厂商、BIOS版本和AMD本身*存在无限多的变量*,因此目前只能具体案例具体分析。
发表于 2023-4-30 13:33 | 显示全部楼层
怎么都不可能只是一个单纯电压高的问题,因为如果只是电压高就会烧,而且其实也就高了这么点,那人人都可以进入BIOS里设置一下某个BIOS里电压参数结果就是boom,但实际上并不会.
我认为,但凡BIOS里能提供的电压参数,首先第一能提供设置的电压参数范围都是安全的,其次任何不安全的参数修改都不应该烧毁U,因为必然存在检测系统来防止这样的事情发生.
发表于 2023-4-30 13:35 | 显示全部楼层
那么更新bios后是否可以复现?
 楼主| 发表于 2023-4-30 13:40 | 显示全部楼层
nApoleon 发表于 2023-4-30 13:33
怎么都不可能只是一个单纯电压高的问题,因为如果只是电压高就会烧,而且其实也就高了这么点,那人人都可以进 ...

确实,但是目前的解决方案似乎就是限制了SoC,因为这个看起来最好“欺负”,不知道会不会召回。
发表于 2023-4-30 13:42 | 显示全部楼层
QQ图片20230430134200.png

发表于 2023-4-30 13:46 | 显示全部楼层
本帖最后由 csnb 于 2023-4-30 19:15 编辑

友商开大绝招了

Been waiting for this: Thanks GNl! Happened to me last weekend: 795x3D.EXPO emabled.3 das after ibuit Pc heard a pop from mobo and PC went dead. Tumns out CPU and MsMag x670e mobo were fiedRMA was approved and 1 was back up and runing the next day. Tupdated to a new BlOs yesterday sol should be good to go: My frst AMD build since theAthlon XP 1800+ in 2001.. and it's a beast! 4090 with 64GB 6000mhz CL30!
机翻:
一直在等这个!谢谢GN!!!上周末发生在我身上!7950x3D...EXPO启用...在我组装完PC的3天后,我听到主板的爆裂声,PC死机了。原来CPU和微星Mag x670e 主板被炸了。RMA 获得批准,第二天我又恢复了运行。我昨天更新到一个新的 BIOS,所以我应该很高兴!自 1800 年 Athlon XP 2001+ 以来,我的第一个 AMD 版本......而且是野兽!4090 与 64GB 6000MHz CL30!
MSI也存在烧毁的案例,这波御三家都凑齐了,AMD背大锅。


视频已搬运

发表于 2023-4-30 13:53 | 显示全部楼层
不是单SOC问题,那就变复杂了啊。
发表于 2023-4-30 13:56 | 显示全部楼层
KingLu 发表于 2023-4-30 13:40
确实,但是目前的解决方案似乎就是限制了SoC,因为这个看起来最好“欺负”,不知道会不会召回。 ...

我想起来以前SM961也有温度过高的问题
三星的解决办法就是一个限制读写速度的固件来降低这个 温度过高 的问题.........
发表于 2023-4-30 14:03 | 显示全部楼层
本帖最后由 ts02147823 于 2023-4-30 14:10 编辑

等新版 AGESA 1.0.0.7


HKEPC

【 AMD 补镬🔥】针对 Ryzen 7000X3D CPU 烧燬事件,AMD 紧急释出了 AGESA 1.0.0.7 韧体来救命,据主机板厂商透露,它并非单纯将 SOC 电压限制在不超过 1.3V 水平,同时修改了 PROCHOT Control 与 ‘PROCHOT Deassertion Ramp Time 两个热安全相关的机制,所以 7000X3D 用家务必尽快更至 AGESA 1.0.0.7 的 BIOS

据了解,PROCHOT Control 是与 CBS 和 SMU_COMMON 相关的函数,它是一种热安全功能,用于防止处理器过热,当处理器的温度达到临界值时,CPU 或其他系统组件会发送 PROCHOT 信号,处理器随即降低功率以降低温度并防止可能的损坏。
PROCHOT Deassertion Ramp Time 是处理器当 PROCHOT 过热讯号发生后,再次回復正常功率的时间定义。当温度回落到临界值以下时,处理器逐渐增加其功率并返回正常工作条件所需的时间间距。

AGESA 1.0.0.7 明显对于 PROCHOT 的定义变得保守,PROCHOT 与 SOC / IMC 相关的电压与温度临界值会大幅降低,同时功耗回復的间距时间会变长,意味着这次 CPU 烧燬事件并非单一原因,一方面是过高的 SOC 电压,加上不完善的热管理构成,不过能否真正解决问题还需时间考証。
各大主机板厂暂时发佈的应急 BIOS 是基于 AGESA 1.0.0.6,只是单纯地限制了 SOC 电压,所以 1.0.0.7 才是 AMD 官方解决方案,AMD 已向主机板厂商提供了 BETA 版本作内测用途,暂定 5 月 6 日提供正式版本
发表于 2023-4-30 14:12 来自手机 | 显示全部楼层
ts02147823 发表于 2023-4-30 14:03
等新版 AGESA 1.0.0.7



这个才比较靠谱,和toms的新闻里root cause热管理一致,没有cpu内部逻辑处理的更新都是治标不治本的方案。asus电压给了高加速了烧毁触发并提高了烧毁概率,toppc lin则更是不屑于解释。
发表于 2023-4-30 14:46 | 显示全部楼层
把视频看完了,总结一下Gamers Nexus的说法:

1. 主要原因是VSOC过高,导致CPU几百度的高温烧毁;

2. VSOC跟EXPO无关,全看板厂的设定;

3. AMD的问题:没有跟板厂沟通好,尤其是安全的电压范围;

4. 华硕的问题:为了内存的兼容性,VSOC给的远高于正常范围;

5. 华硕的问题:主板的OCP形同虚设(否则在炸U的时候可以保护主板);

6. 某嘉的问题:有一个bug,导致没有加载默认或用户输入的VSOC;

7. 华硕主板的VDDIO电压加载也不对(但好像跟烧毁无关),AMD或华硕背锅;

8. AMD对CPU保修(即使开EXPO),但不清楚各板厂是否承诺保修主板。
发表于 2023-4-30 14:59 | 显示全部楼层
nApoleon 发表于 2023-4-30 13:33
怎么都不可能只是一个单纯电压高的问题,因为如果只是电压高就会烧,而且其实也就高了这么点,那人人都可以进 ...

我在ASUS X99-E WS上曾遇到过,某次启动进bios看到CPU跑在1.7v,都紫红色了。
因为温度也不对,所以应该不是电压误读... 但这个问题我后面就没再复现过了。

所以检测系统可能没有,或者非常弱,或者本身就有bug,或者本身就是罪魁祸首...
发表于 2023-4-30 15:00 | 显示全部楼层
AIAO 发表于 2023-4-30 14:46
把视频看完了,总结一下Gamers Nexus的说法:

1. 主要原因是VSOC过高,导致CPU几百度的高温烧毁;

确实....
ASUS X670EE,SOC和VDDIO的实际电压全往1.4-1.45v去了
发表于 2023-4-30 15:01 | 显示全部楼层
本帖最后由 T.JOHN 于 2023-4-30 15:29 编辑

一些超频玩家感兴趣的事实
1. igpu不止从SOC取电,还从vcore取电
2. SOC电压部分会跑进CCD

电路图(中间那张图来自于板厂)


失效图


部分硅渣问题。大致意思是由于少数晶体体质或封装不佳,auto下可能给出超出工程师预计很高的电压,但这些电流流不过去,仍然不足供给满足soc工作的电流,导致额外发热。对于AMD来说这种问题由于存在不同工艺节点的soc和ccd和封装,很难在QA/QC环节中发现。加上主板BIOS的QC,难免有漏网之鱼。


各家板厂SOC电压对比(不过这不重要,反正AMD把锅背好了,其他人都是次责)


EXPO的profile不涉及SOC电压,SOC电压是板厂给的,内存厂商不背锅

如果你在打人的主板上,内存超频蓝屏了,可能是启用了内置AMD菜单中后,VDDIO电压给低了
发表于 2023-4-30 15:11 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2023-4-30 15:32 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2023-4-30 15:37 | 显示全部楼层
gbawrc 发表于 2023-4-30 15:32
问题1:一颗品控合格的CPU,为什么会出现几百度的高温,CPU里那么多传感器检测不到温度异常?检测到温度 ...

几百度是在烧毁的时候。之前是由于过高的VSOC(同时影响IOD和CCD),加速硅的老化。具体原理可能要等第二期视频了。
发表于 2023-4-30 15:55 | 显示全部楼层
我没听错的话,GN说的是cpu电压过高短路,返回00信号,但华硕的主板没有重置电压,而是继续往socket上灌电流,直到cpu的焊接点融化。cpu本身在烧毁前就已经死机了,主板没能正确识别,继续供电。



发表于 2023-4-30 15:59 | 显示全部楼层
T.JOHN 发表于 2023-4-30 15:01
一些超频玩家感兴趣的事实
1. igpu不止从SOC取电,还从vcore取电
2. SOC电压部分会跑进CCD

GN视频里有出现的X670EE,确实就是EXPO开启后AUTO=1.35v,实际负载时会跑到1.42v...
我裂开... 我今天就遇到了一次奇怪的突然黑屏重启....emmmm...
发表于 2023-4-30 16:00 | 显示全部楼层
gbawrc 发表于 2023-4-30 15:32
问题1:一颗品控合格的CPU,为什么会出现几百度的高温,CPU里那么多传感器检测不到温度异常?检测到温度 ...

这应该不关生产品控的事,是产品设计出了问题,厂商在调试主板BIOS的时候也没有做相关的考虑和测试。
发表于 2023-4-30 16:02 来自手机 | 显示全部楼层
msi躲过一劫?
发表于 2023-4-30 16:02 | 显示全部楼层
这波不得召回?不在硬件底层加以限制,而直接限制最高电压,那岂不是白白限制性能,喂用户shit?而且看上边几位兄弟总结,似乎不仅仅是电压问题,那新AGESA下去又有tweaker搞炸了硬件谁还买zen4?
发表于 2023-4-30 16:03 | 显示全部楼层
我比较关心的是,最新bios下会不会性能缩水...
发表于 2023-4-30 16:05 来自手机 | 显示全部楼层
nApoleon 发表于 2023-4-30 13:33
怎么都不可能只是一个单纯电压高的问题,因为如果只是电压高就会烧,而且其实也就高了这么点,那人人都可以进 ...

华硕电压远高于友商,这锅背不背…不知之前的卵子还切不? 还是先挂着
发表于 2023-4-30 16:07 | 显示全部楼层
掩不住的锋芒 发表于 2023-4-30 16:05
华硕电压远高于友商,这锅背不背…不知之前的卵子还切不? 还是先挂着 ...

高这点就烧U我觉得但凡有点阅历的玩家都很清楚这不可能发生的...
发表于 2023-4-30 16:11 | 显示全部楼层
温度管理为什么不起作用,会不会是设计/制造工艺瑕疵,导致供电通路存在电阻过高的瑕疵热点,会慢慢积累发热烧蚀,过高的SOC电压会加速这个过程,最后彻底爆发烧毁,而温度监控一般在CPU核心区域,监控不到问题所在区域
发表于 2023-4-30 16:12 | 显示全部楼层
简单描述:cpu过热死机后,主板重启上电的过程中沿用了bios设定中超高的soc电压,叠加上启动状态下cpu会加载最大电流来保证启动顺利(cpu启动基本流程)。

然后由于soc有多个不同的供电域,设计上来说都是互相隔离,单独接地的。但是芯片制程演化到现在的阶段,所有芯片都会有漏电流,导致高压的供电域的电流往低压(正常电压)区域流动堆积大量热能。

您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-2-3 00:48 , Processed in 0.013576 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表