AMD EPYC 7002是他们在2019年推出的服务器处理器,采用Zen 2架构,代号为Rome,而近日AMD发布了EPYC 7002处理器的勘误表,上面指出“在上次系统重置后大约1044天后,内核将无法退出CC6。”要解决这一问题你需要重启服务器,而且AMD已经表示不会修复这一问题。
1044天大约是34个月的时间,也就是说不到3年,而准确的时间应该是1042天12小时,出问题的可能是CPU REFCLK在54位带符号整数中计算10ns滴答,如果你计算这些滴答中的9千万亿次以上,你会在1042天12小时的时候溢出,一旦发生溢出内核就将处于卡死状态,并且不会接受任何外部中断请求,直到你把电源关闭并重启,这就能重置计算器了。
这个问题能够被发现就表明不止一个系统练习运行了将近三年而且还没有重启,发现这个漏洞应该花了很多时间,AMD的指南中表示,导致这个问题的原因是内核无法脱离CC6省电模式,进入该模式后会降低CPU电压和时钟频率,而不同系统出bug的时间误差可能取决于扩频调制和REFCLK频率惨况。
AMD不打算发布任何针对CC6错误的修复程序,而是建议管理员禁用CC6以避免内核卡死,或者干脆在时间期限来临前定期重启一次系统。
VEGA教授 06-05 11:07 | 加入黑名单
ROME是2019年发的,那发现这个BUG基本上是2020年配置好服务器到现在就没关机过才发现的
支持(47) | 反对(0) | 举报 | 回复
1#
RainMax教授 06-06 10:10 | 加入黑名单
就尼玛离谱
支持(4) | 反对(0) | 举报 | 回复
7#
打哈刷卡机初中生 06-06 05:38 | 加入黑名单
练习超过两年半 谁都得出问题
支持(10) | 反对(0) | 举报 | 回复
6#
茶扉丶博士 06-05 18:33 | 加入黑名单
AMD不去当网管可惜了,重启、拍拍、换机子!
支持(8) | 反对(0) | 举报 | 回复
5#
zhaoyun980终极杀人王 06-05 12:30 | 加入黑名单
意思是重启能好就不叫BUG
已有3次举报支持(8) | 反对(2) | 举报 | 回复
4#
itck终极杀人王 06-05 11:48 | 加入黑名单
好家伙………
支持(6) | 反对(0) | 举报 | 回复
3#
12345jv v ji教授 06-05 11:34 | 加入黑名单
这。。。…
已有1次举报支持(9) | 反对(0) | 举报 | 回复
2#
提示:本页有 7 个评论因未通过审核而被隐藏