英伟达将推出H800系列计算卡：限制互连速率，新款中国市场特供产品

吕嘉俭发布于 2023-3-24 16:50

拼命加载中 ...

基于Ampere架构的A100系列计算卡在过去近三年里，被众多高性能计算集群（HPC）所采用，英伟达在去年推出了新一代基于Hopper架构的H100系列计算卡，进一步提高了算力，这些GPU大量用于人工智能和深度学习任务。

由于众所周知的原因，英伟达为了绕开去年施加的相关出口限制，推出了A800系列计算卡，专供中国市场使用。与原有的A100系列计算卡相比，A800系列的规格基本相同，比较大的区别在于NVLink互连总线的连接速率，前者为600 GB/s，后者限制在了400 GB/s。

据相关媒体报道，英伟达今年采用了相同的方法，将普通H100 PCIe型号的互连速率减掉大概一半左右，推出了H800系列计算卡，以供中国市场。相比于正常的H100产品，由于被限制导致输出减慢，在某些大型模型训练里的延迟会增加，降低了工作负荷。

有媒体联系英伟达了解情况，询问H100和H800之间的区别，不过英伟达没有给出正面回应，解释其中的差别，仅表示H800系列计算卡完全符合出口管制法规。

完整的GH100芯片配置了8组GPC、72组TPC、144组SM、共18432个FP32 CUDA核心。其采用了第四代Tensor Core，共576个，并配有60MB的L2缓存。有不过实际产品中没有全部打开，其中SXM5版本中启用了132组SM，共16896个FP32 CUDA核心，528个Tensor Core以及50MB的L2缓存，而PCIe 5.0版本则启用了114组SM，FP32 CUDA核心数量只有14592个。此外，前者的TDP达到了700W，后者则为350W。

此外，H100支持英伟达第四代NVLink接口，可提供高达900 GB/s的带宽。同时H100是第一款支持PCIe 5.0标准的GPU，也是第一款采用HBM3的GPU，最多支持六颗HBM3，带宽为3TB/s，是A100采用HBM2E的1.5倍，默认显存容量为80GB。