基于Ampere架构的A100系列计算卡在过去近三年里,被众多高性能计算集群(HPC)所采用,英伟达在去年推出了新一代基于Hopper架构的H100系列计算卡,进一步提高了算力,这些GPU大量用于人工智能和深度学习任务。
由于众所周知的原因,英伟达为了绕开去年施加的相关出口限制,推出了A800系列计算卡,专供中国市场使用。与原有的A100系列计算卡相比,A800系列的规格基本相同,比较大的区别在于NVLink互连总线的连接速率,前者为600 GB/s,后者限制在了400 GB/s。
据相关媒体报道,英伟达今年采用了相同的方法,将普通H100 PCIe型号的互连速率减掉大概一半左右,推出了H800系列计算卡,以供中国市场。相比于正常的H100产品,由于被限制导致输出减慢,在某些大型模型训练里的延迟会增加,降低了工作负荷。
有媒体联系英伟达了解情况,询问H100和H800之间的区别,不过英伟达没有给出正面回应,解释其中的差别,仅表示H800系列计算卡完全符合出口管制法规。
完整的GH100芯片配置了8组GPC、72组TPC、144组SM、共18432个FP32 CUDA核心。其采用了第四代Tensor Core,共576个,并配有60MB的L2缓存。有不过实际产品中没有全部打开,其中SXM5版本中启用了132组SM,共16896个FP32 CUDA核心,528个Tensor Core以及50MB的L2缓存,而PCIe 5.0版本则启用了114组SM,FP32 CUDA核心数量只有14592个。此外,前者的TDP达到了700W,后者则为350W。
此外,H100支持英伟达第四代NVLink接口,可提供高达900 GB/s的带宽。同时H100是第一款支持PCIe 5.0标准的GPU,也是第一款采用HBM3的GPU,最多支持六颗HBM3,带宽为3TB/s,是A100采用HBM2E的1.5倍,默认显存容量为80GB。
12345jv v ji教授 03-24 20:18 | 加入黑名单
老黄真得庆幸自己在那地方,要在某个地方敢这么搞说不好第二天就失联了
已有4次举报支持(35) | 反对(7) | 举报 | 回复
3#
晕陀陀一代宗师 03-25 13:50 | 加入黑名单
大冤种系列
支持(2) | 反对(0) | 举报 | 回复
5#
我匿名了 03-24 20:36
绞索是一步步收紧的,除了NVLink带宽阉割,H800的双精也没了,意图再明显不过...
支持(6) | 反对(0) | 举报 | 回复
4#
恒温麾下教授 03-24 18:18 | 加入黑名单
没有永恒的朋友,也没有永恒的敌人,只有永恒的利益
支持(6) | 反对(4) | 举报 | 回复
2#
tao123博士 03-24 17:50 | 加入黑名单
老黄的刀法炉火纯青,他够胆出的,只看你敢不敢买。
支持(6) | 反对(0) | 举报 | 回复
1#
提示:本页有 5 个评论因未通过审核而被隐藏