在上个月举行的ISC 2021上,英特尔介绍了一系列的技术,并确认Sapphire Rapids Xeon处理器可配置HBM内存。通过加入HBM内存,可以显着提升内存带宽,并提升运行内存带宽敏感型工作负载的HPC应用程序的性能。如果没有搭配DDR5内存的情况下,可以作为主内存使用,若与DDR5内存结合,则可作为L4缓存使用。有消息指,Sapphire Rapids Xeon处理器最多可配备56个核心,以及64GB的HBM2e内存,通过EMIB技术互联。
当然,英特尔Sapphire Rapids Xeon处理器并不是第一个选择HBM作为内存使用的厂商。目前排名第一的超级计算机Fugaku使用的富士通A64FX处理器,板载了32GB的HBM2内存作为主内存,处理器与HBM2内存之间通过使用中间模块连接,结构类似于现在的GPU,而且没有额外配置DDR4内存。
据Inpact-Hardware报道,AMD也在计划代号Genoa的EPYC处理器上推出搭载HBM内存的型号,以应对配置HBM内存的Sapphire Rapids Xeon处理器。不过AMD仍在与合作伙伴讨论这个问题,似乎还没有做最后的决定。为客户在基于Zen 4架构的产品上保留这样的方案问题不大,但也有可能最终是大容量3D V-Cache的方案。
传闻AMD会在Zen 4架构产品推出前,还有一款代号Milan-X的EPYC处理器。这与桌面平台上加入3D V-Cache的Zen 3架构Ryzen处理器类似,通过3D堆叠技术提高缓存效率。这也让大家对AMD未来会采用什么方法集成HBM内存产生了兴趣,除了传统的片外方式,也可能通过3D堆叠技术实现。
wufuwen博士 2021-07-20 17:16 | 加入黑名单
未来很美好!
支持(0) | 反对(0) | 举报 | 回复
5#
VEGA教授 2021-07-19 16:51 | 加入黑名单
我就直白点说吧,堆cache主要是缓解IOD到内存的延迟用的,所以可以在游戏里获得很大的收益,因为游戏级别都是延迟敏感型,cache够大就可以让相当量的游戏数据不通过内存,直接在cache内和CPU交换
而EPYC这种商用处理器,本身处理的工作就不看重延时,作为EPYC应用最常见的数据中心,真正的延迟瓶颈在网络上,而不在CPU和内存上
ROME为了保证处理器低功耗,连IOD都调教在2666下,直到MILAN才把IOD调教拉到了3200,然而数据中心还是倾向于购买内存延迟更高但是功耗更低的ROME
我就直白点说吧,堆cache主要是缓解IOD到内存的延迟用的,所以可以在游戏里获得很大的收益,因为游戏级别都是延迟敏感型,cache够大就可以让相当量的游戏数据不通过内存,直接在cache内和CPU交换
而EPYC这种商用处理器,本身处理的工作就不看重延时,作为EPYC应用最常见的数据中心,真正的延迟瓶颈在网络上,而不在CPU和内存上
ROME为了保证处理器低功耗,连IOD都调教在2666下,直到MILAN才把IOD调教拉到了3200,然而数据中心还是倾向于购买内存延迟更高但是功耗更低的ROME
支持(7) | 反对(2) | 举报 | 回复
4#
我匿名了 2021-07-19 13:13
支持(0) | 反对(1) | 举报 | 回复
3#
yochee教授 2021-07-19 10:14 | 加入黑名单
HBM应该是补全APU的最后一块拼图,到时候就是真·单片机了(不算硬盘)
支持(4) | 反对(0) | 举报 | 回复
2#
VEGA教授 2021-07-19 09:43 | 加入黑名单
堆cache增加的是游戏性能,专业性能不吃cache,其实不说EPYC了,我都不知道TR有没有必要上3D-cache
反正rome和milan的多核心性能差异少得可怜,amd现在主要出货的还是rome,说白了专业用户还是看重核多,单核心性能没那么重要
支持(2) | 反对(1) | 举报 | 回复
1#
提示:本页有 5 个评论因未通过审核而被隐藏