E X P
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    在美国加州圣何塞会议中心举行的GTC 2024大会上,英伟达创始人兼CEO黄仁勋带来了Blackwell架构GPU,包括用于取代H100/H200的B200 GPU,另外还有与Grace CPU相结合的GB200。

    B200采用了台积电(TSMC)改进的4NP定制工艺制造,整合了两个独立制造的Die,共有2080亿个晶体管,使用了新的NVLink 5.0技术来连接两块芯片。其拥有160组SM,对应20480个核心,搭配的使192GB的HBM3E,提供了高达8TB/s的带宽,功耗达到了700W。B200单个GPU提供了20 petaflops的AI性能,大概五倍于H100的4 petaflops。由于引入了第二代Transformer引擎,将有助于自动将模型转换为适当的格式以达到最佳性能。此外,Blackwell架构GPU还支持新的FP6格式,这是一种介于FP4和FP8两者之间的解决方案。

    暂时还不清楚台积电4NP工艺的细节,但密度方面应该不会有明显的提升,而之前的H100基本上已经是一个完整的掩模版,芯片尺寸为814mm2,而理论最大值为858mm2。为此B200使用了两个全尺寸掩模版制造的芯片,每个对应四个HBM3E堆栈,每个堆栈的接口为1024-bit、容量为24GB、带宽为1TB/s。相比之下,每个H100芯片对应六个HBM3接口,意味着B200每个芯片可以减少内存控制器所需要的芯片面积,从而将更多的晶体管用于计算单元。此外,用于两个芯片互连的NV-HBI接口也会占用一些空间。

    英伟达的Superchip被设计为人工智能(AI)和高性能计算(HPC)工作负载的典型平台,这次将Blackwell架构GPU与Grace CPU结合推出了GB200 Grace Blackwell Superchip。其配备了两个B200 GPU和一个Grace CPU,后者配有72核心的Arm Neoverse V2内核,可配置TDP高达2700W。新平台提供了40 PetaFlops的计算性能 (INT8),并拥有864GB的庞大内存池,HBM3E具有16TB/s的内存带宽,芯片之间通过3.6TB/s带宽的NVLink进行互连。

    英伟达还带来了全新的GB200 NVL72计算平台,这是一个全机架解决方案,有18个1U服务器。其提供的FP8性能为720 petaflops,FP4计算性能为1440 petaflops,可处理多达27万亿个AI LLM参数模型。每台服务器里带有两个GB200 Grace Blackwell Superchip,合计共有36个Grace CPU和72个Blackwell GPU。这些计算节点带有1.7TB的HBM3E内存、32TB/s的内存带宽,并且全部采用液冷MGX封装。

    每个机架内还有ConnectX-800G Infiniband SuperNIC,以及一个用于网络内计算的Bluefield-3 DPU(80GB/s内存带宽)。另外还会有最新的NVLINK交换机,具有8个接口,速率为1.8TB/s,总带宽高达14.4TB/s。英伟达还推出了新款NVLink Switch芯片,拥有500亿个晶体管,采用了台积电4NP工艺制造,提供了7.2TB/s带宽,用于不同节点之间的通信互连。

    英伟达通过八个GB200 NVL72计算平台,组成了新的DGX SuperPOD,合计共有288个Grace CPU和576个B200 GPU。这本身就是一台AI超级计算机,具有240TB内存,提供了11.5 exaflops的FP4计算能力。

    英伟达通过发布Blackwell架构GPU,再次巩固了自身在人工智能市场的主导地位,开创了AI计算的新时代。Dell、思科、HPE、联想、Supermicro、Aivres、华擎、华硕、Eviden、富士康、技嘉、英业达、和硕、云达、纬创、Wiwynn和ZT Systems等OEM厂商也将在未来提供各自的解决方案。

    ×
    热门文章
    1《黑神话 : 悟空》简体中文PC标准版官宣定价268元,并带来全新宣传片
    2联力A3-mATX开启预售:26L桌面机箱,黑白双色,首发399元起
    3Zen 6有三种CCD配置:最多单个32核,Zen 5c单CCX包含16核
    4华硕ROG STRIX PG27AQDM显示器上市:2K@240Hz,OLED屏,首发4999元
    5RTX 4060在韩国登顶销售额榜首,RTX 4070 Super在Super系列中最受欢迎
    6OPPO K12x今日首销:搭载OLED直屏以及80W快充,1299元起售
    7传MacBook Pro今年内更新M4系列芯片,但Mac Studio、Mac Pro还要到明年
    8传闻第四代骁龙8移动平台将再涨价,“N3E”工艺增加了生产成本
    9银昕推出FARA 514X机箱:全穿孔网状前面板设计,支持双360mm冷排
    已有 4 条评论,共 7 人参与。
    登录快速注册 后发表评论
    • Xeonash教授 03-20 00:23    |  加入黑名单

      意念中的空气 教授

      老黄看起来好苍老了…有点迟暮感
      没之前10系那会儿看着精气神强。
      03-19 10:38
    • 支持(1)  |   反对(0)  |   举报  |   回复
    • 老黄今年60多了,显老才正常吧,10系显卡发布都是16年的事了

      支持(2)  |   反对(0)  |   举报  |   回复

      4#

    • welsper博士 03-19 11:22    |  加入黑名单

      一张B200相当于多少张H20?

      支持(0)  |   反对(0)  |   举报  |   回复

      3#

    • 我匿名了  03-19 10:49

      一张卡就十几万了吧,还要受限

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • 意念中的空气教授 03-19 10:38    |  加入黑名单

      老黄看起来好苍老了…有点迟暮感
      没之前10系那会儿看着精气神强。

      支持(1)  |   反对(0)  |   举报  |   回复

      1#

    提示:本页有 4 个评论因未通过审核而被隐藏

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明