找回密码
 加入我们
搜索
      
查看: 12330|回复: 27

[PC硬件] AMD承认EPYC Rome处理器在运行1044天后会卡死, 暂无修复计划

[复制链接]
发表于 2023-6-6 00:05 | 显示全部楼层 |阅读模式
AMD EPYC 7002是他们在2019年推出的服务器处理器,采用Zen 2架构,代号为Rome,而近日AMD发布了EPYC 7002处理器的勘误表,上面指出“在上次系统重置后大约1044天后,内核将无法退出CC6。”要解决这一问题你需要重启服务器,而且AMD已经表示不会修复这一问题。

EPYC_Rome1.JPG

1044天大约是34个月的时间,也就是说不到3年,而准确的时间应该是1042天12小时,出问题的可能是CPU REFCLK在54位带符号整数中计算10ns滴答,如果你计算这些滴答中的9千万亿次以上,你会在1042天12小时的时候溢出,一旦发生溢出内核就将处于卡死状态,并且不会接受任何外部中断请求,直到你把电源关闭并重启,这就能重置计算器了。

EPYC_Rome.jpg

这个问题能够被发现就表明不止一个系统练习运行了将近三年而且还没有重启,发现这个漏洞应该花了很多时间,AMD的指南中表示,导致这个问题的远呀是内核无法脱离CC6省电模式,进入该模式后会降低CPU电压和时钟频率,而不同系统出bug的时间误差可能取决于扩频调制和REFCLK频率惨况。

AMD不打算发布任何针对CC6错误的修复程序,而是建议管理员禁用CC6以避免内核卡死,或者干脆在时间期限来临前定期重启一次系统。

https://www.expreview.com/88653.html

评分

参与人数 1邪恶指数 +20 收起 理由
灯下狐 + 20

查看全部评分

发表于 2023-6-6 01:00 | 显示全部楼层
禁用CC6省电模式可解决
发表于 2023-6-6 01:42 | 显示全部楼层
这C6的bug是真的多,从zen1开始就有
发表于 2023-6-6 09:07 | 显示全部楼层
为何是1044?
发表于 2023-6-6 10:00 | 显示全部楼层

1024+20?
发表于 2023-6-6 10:44 | 显示全部楼层
这种类似计数器的问题,感觉听玄学的。
当初怎么会有这种漏洞的呢。。。
发表于 2023-6-6 10:52 | 显示全部楼层
为啥不是1024 天? 还要+20
发表于 2023-6-6 11:04 | 显示全部楼层
所以OEM商会直接刷个BIOS禁用CC6吗?
发表于 2023-6-6 11:10 | 显示全部楼层
本帖最后由 jiongtl 于 2023-6-7 11:22 编辑

54位带符号整数最大值二进制是 11111111111111111111111111111111111111111111111111111 ,换算成十进制就是 9007199254740991 ,每 10ns 递增那换算成天就是 9007199254740991 / 100000000 / 3600 / 24 = 1042.499913743 天。
发表于 2023-6-6 12:12 | 显示全部楼层
intel即将大卖
发表于 2023-6-6 12:40 | 显示全部楼层
jiongtl 发表于 2023-6-6 11:10
54位带符号整数最大值二进制是 11111111111111111111111111111111111111111111111111111 ,换算成十进制就 ...

哈哈哈哈哈哈 真相
发表于 2023-6-6 13:55 | 显示全部楼层
jiongtl 发表于 2023-6-6 11:10
54位带符号整数最大值二进制是 11111111111111111111111111111111111111111111111111111 ,换算成十进制就 ...

兄弟 牛逼了
发表于 2023-6-6 15:05 | 显示全部楼层
jiongtl 发表于 2023-6-6 11:10
54位带符号整数最大值二进制是 11111111111111111111111111111111111111111111111111111 ,换算成十进制就 ...

哈,这是1042,而且是年吧
发表于 2023-6-6 15:36 | 显示全部楼层
jiongtl 发表于 2023-6-6 11:10
54位带符号整数最大值二进制是 11111111111111111111111111111111111111111111111111111 ,换算成十进制就 ...

技术流 赞
发表于 2023-6-6 15:55 | 显示全部楼层
7002是大船价。
不知道7003还有问题吗
发表于 2023-6-6 16:39 | 显示全部楼层
jiongtl 发表于 2023-6-6 11:10
54位带符号整数最大值二进制是 11111111111111111111111111111111111111111111111111111 ,换算成十进制就 ...

牛啤(破音).....
发表于 2023-6-6 18:16 | 显示全部楼层
glamor 发表于 2023-6-6 15:55
7002是大船价。
不知道7003还有问题吗

不知道还要测试下可能要等9004/9005横行的时候才知道。。。
发表于 2023-6-6 18:30 | 显示全部楼层
jiongtl 发表于 2023-6-6 11:10
54位带符号整数最大值二进制是 11111111111111111111111111111111111111111111111111111 ,换算成十进制就 ...

专业。。。。。。。。。。。
发表于 2023-6-6 19:59 | 显示全部楼层
jiongtl 发表于 2023-6-6 11:10
54位带符号整数最大值二进制是 11111111111111111111111111111111111111111111111111111 ,换算成十进制就 ...

虽然我看的晕晕乎乎的,但是,谢谢解惑。
发表于 2023-6-6 20:29 | 显示全部楼层
牛啤(破音).....
发表于 2023-6-6 22:28 | 显示全部楼层
jiongtl 发表于 2023-6-6 11:10
54位带符号整数最大值二进制是 11111111111111111111111111111111111111111111111111111 ,换算成十进制就 ...

老哥专业
发表于 2023-6-6 23:29 | 显示全部楼层
amd这么狂???
发表于 2023-6-7 02:04 | 显示全部楼层

小问题吧?每3年重启一下服务器就解决了。
发表于 2023-6-7 08:39 | 显示全部楼层
开这么久都不关机维护下?
发表于 2023-6-7 13:52 | 显示全部楼层
这种算是低级bug了吧?
发表于 2023-6-7 16:13 | 显示全部楼层
有没有一种可能是intel也有这个问题 但是没有那台坚持过3年没重启 所以就没发现这个问题啊。  我N5105的软路由  就没见过连续启动时间超过2-3个月的,不知道什么时候就自己重启了。。
发表于 2023-6-7 17:13 | 显示全部楼层
jiongtl 发表于 2023-6-6 11:10
54位带符号整数最大值二进制是 11111111111111111111111111111111111111111111111111111 ,换算成十进制就 ...

应该用补码吧
发表于 2023-6-7 21:07 | 显示全部楼层
jiongtl 发表于 2023-6-6 11:10
54位带符号整数最大值二进制是 11111111111111111111111111111111111111111111111111111 ,换算成十进制就 ...

牛啊就这是大牛哈
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-1-1 23:47 , Processed in 0.016909 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表