找回密码
 加入我们
搜索
      
查看: 15458|回复: 59

[CPU] AMD确认EPYC Rome CPU存在BUG,需要每隔34个月重启

[复制链接]
发表于 2023-6-6 00:18 | 显示全部楼层 |阅读模式
无修复计划~


原文:“https://www.techpowerup.com/3095 ... 34-months-of-uptime

“AMD 最近发布了基于 Zen 2 的第二代 EPYC 处理器的勘误表,其中指出,“在上次系统重置后大约 1044 天后,内核将无法退出 CC6。” 1044 天大约是 34 个月,或者说只有不到 3 年的总正常运行时间,根据 Reddit 和 Twitter 上的一些系统管理员侦探进行数学计算并发现实际时间是 1042 天 12 小时,这实际上是一个高估。出现问题是因为 CPU REFCLK 在 54 位带符号整数中计算 10ns 滴答,如果您计算这些滴答中的 9 千万亿次以上,您会在 1042.4999 天得到溢出。一旦发生这种溢出,内核将永远处于僵尸状态,并且不会接受任何外部中断请求。好吧,直到你关闭电源开关然后再打开,这将重置计数器。

发现这个问题确实令人印象深刻,因为它表明不止一个系统已经连续运行了将近三年而没有重新启动。尽管这确实使 EPYC“罗马”无法获得运行时间最长的系统的任何可能奖项,但它可以提醒人们启动系统更新或修补自那一代处理器问世以来四年内发现的其他漏洞。首次推出。AMD 不打算发布任何针对 CC6 错误的修复程序,而是建议管理员禁用 CC6 以避免内核进入僵尸化状态,或者干脆在时限到期前每隔一段时间启动一次重启。”

BUG.jpg
发表于 2023-6-6 01:57 来自手机 | 显示全部楼层
意料之中,AMD就像一个资本捧起来的小鲜肉流量明星,就看看它的股票泡沫还能持续多久。
发表于 2023-6-6 02:02 来自手机 | 显示全部楼层
HZJ 发表于 2023-6-6 01:57
意料之中,AMD就像一个资本捧起来的小鲜肉流量明星,就看看它的股票泡沫还能持续多久。 ...

amd虽然只是千年老二,但从你的回复中看到了另外的解读: 酸
发表于 2023-6-6 02:04 | 显示全部楼层
网友们的解读越来越牛逼了
发表于 2023-6-6 02:15 | 显示全部楼层
HZJ 发表于 2023-6-6 01:57
意料之中,AMD就像一个资本捧起来的小鲜肉流量明星,就看看它的股票泡沫还能持续多久。 ...

呵呵
发表于 2023-6-6 02:40 | 显示全部楼层
网友们的解读越来越牛逼了
发表于 2023-6-6 08:38 | 显示全部楼层
CHH贴吧化
发表于 2023-6-6 08:41 | 显示全部楼层
本帖最后由 ljy1414 于 2023-6-6 08:42 编辑
HZJ 发表于 2023-6-6 01:57
意料之中,AMD就像一个资本捧起来的小鲜肉流量明星,就看看它的股票泡沫还能持续多久。 ...


对,你清高,你家intel直接提前CPU暴毙,连重启的机会都没有
也不撒泡尿照照镜子,穿着一身白娘子装,露处一脸恶心人的笑容
恶心人就算了,也不动动脑子翻翻帖子,眼瞎吗?

https://www.hkepc.com/18366/

Snipaste_2023-06-06_08-39-43.jpg
发表于 2023-6-6 08:44 | 显示全部楼层
我就是敢祖安你2F,你TM 2F玻璃心碎麻烦你去举报,出门右拐不送客,滚!!
发表于 2023-6-6 09:06 | 显示全部楼层
所以amd把二楼怎么了?还是说他股票抛早了?
意料之中也没见发个预言贴啊,马后炮谁不会
发表于 2023-6-6 09:07 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2023-6-6 09:08 | 显示全部楼层
楼里好多纠察队呀,果然是流量明细
发表于 2023-6-6 09:16 | 显示全部楼层
2F发言过于逆天
发表于 2023-6-6 09:17 | 显示全部楼层
有点BUG啥的不是很正常么。。。哪家能说自己100%完美
发表于 2023-6-6 09:27 | 显示全部楼层
2L欢乐
发表于 2023-6-6 09:30 | 显示全部楼层
夏天快到了 活是越来越密了 给我整笑了
发表于 2023-6-6 09:34 | 显示全部楼层
举手问一下,一般服务器需要重启吗?
我就知道打的网游服务器一般需要重启
发表于 2023-6-6 10:09 | 显示全部楼层
台湾基佬越来越暴躁了,但是骂的真爽
发表于 2023-6-6 10:14 | 显示全部楼层
好歹也稳定运行34个月,不然这BUG都发现不了
发表于 2023-6-6 10:14 | 显示全部楼层
真有机房服务器能连续跑三年不升级不重启么
发表于 2023-6-6 10:18 | 显示全部楼层
qiu95 发表于 2023-6-6 10:14
真有机房服务器能连续跑三年不升级不重启么

HPE有出rome架构的存储
发表于 2023-6-6 10:25 | 显示全部楼层
ljy1414 发表于 2023-6-6 08:41
对,你清高,你家intel直接提前CPU暴毙,连重启的机会都没有
也不撒泡尿照照镜子,穿着一身白娘子装,露 ...

DSM和QNAP对这个问题作出回应,说不会影响他们产品,但是一查也有不少暴毙
发表于 2023-6-6 10:27 | 显示全部楼层
ljy1414 发表于 2023-6-6 08:44
我就是敢祖安你2F,你TM 2F玻璃心碎麻烦你去举报,出门右拐不送客,滚!!

Snipaste_2023-06-06_10-27-02.jpg
发表于 2023-6-6 10:29 | 显示全部楼层
禁止梭哈 发表于 2023-6-6 10:18
HPE有出rome架构的存储

HPE存储炸盘都已经两次了,这个比系统死机严重多了。

企业级SSD硬盘可靠性要求很高,只不过万一遇到事也没法了。HPE(惠普企业,也叫惠与)公司的多款SAS硬盘就遭遇了这样的麻烦,运行40000小时之后硬盘会挂掉,数据也会丢失。

更麻烦的是,这已经是HPE的企业级硬盘第二次出现类似的bug了。去年11月份,HPE的SAS硬盘出现为了奇怪的bug,通电时间累计达到32768小时(3年零270天8小时)后直接挂掉,导致数据丢失。

当时HPE方面没有明确原因,但外界猜测与16位计算系统的整数溢出有关,32768是这套系统能处理的最大负整数,32767是最大正整数。

之后HPE发布了新的HPD8固件,解决了掉盘问题。没想到的是,在运行40000小时时这个问题又回来了,也是掉盘+数据丢失。

该问题影响HPE 800GB/1.6TB 12G SAS SSD、HPE ProLiant、Synergy、Apollo 4200及Synergy Storage Modules、D3000 Storage Enclosure和StoreEasy 1000 Storage服务器、存储阵列上的SAS WI-1/MU-1 SFF SC SSD硬盘。
发表于 2023-6-6 10:31 | 显示全部楼层
londbell 发表于 2023-6-6 10:25
DSM和QNAP对这个问题作出回应,说不会影响他们产品,但是一查也有不少暴毙 ...

我记得有不少人买华擎的主板上了黑裙吧?
不知道那些华擎主板是否还安好...
发表于 2023-6-6 10:34 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2023-6-6 10:42 | 显示全部楼层
slymitec 发表于 2023-6-6 10:34
我比较关心Zen3、Zen4是否也有这样的问题,毕竟1000多天,哪怕Zen3目前也还体现不出来。 ...



家用机  很少有人2 3年不重启吧
以前玩网游 维护不也是1周1次嘛= =
发表于 2023-6-6 10:43 | 显示全部楼层
话说服务器维保是几年?
发表于 2023-6-6 10:48 | 显示全部楼层
一坤年重启一次。
发表于 2023-6-6 10:49 | 显示全部楼层
伊万科涅夫 发表于 2023-6-6 10:29
HPE存储炸盘都已经两次了,这个比系统死机严重多了。

企业级SSD硬盘可靠性要求很高,只不过万一遇到事也 ...

HPE我只接触过小型机,3par,nimble和带库,只修过这些玩意,存储整机宕了和坏盘还是有区别的。如果是到了那个时间统一会宕没时间差的话
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-2-4 10:00 , Processed in 0.014721 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表