E X P
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    英伟达宣布,针对大型语言模型训练(LLM)设计,推出全新的H100 NVL计算加速卡。其搭载了两个基于Hopper架构的H100芯片,顶部配备了三个NVLink连接器,在服务器里使用了两个相邻的PCIe全长插槽。

    英伟达去年就推出了H100,拥有800亿个晶体管,相比上一代的A100,有着六倍的性能提升以及两倍的MMA改进。其采用了CoWoS 2.5D晶圆级封装,单芯片设计,以台积电(TSMC)为英伟达量身定制的4N工艺制造。这次双GPU版本除了更高的计算性能,更大的显存容量也是其优势之一,提供了188GB的HBM3显存。

    H100 NVL计算加速卡的FP64计算性能为134 teraFLOPS,TF32计算性能为1979 teraFLOPS,FP8计算性能为7916 teraFLOPS,INT8计算性能为7916 teraFLOPS,是H100 SXM的两倍。其具有完整的6144位显存接口(每个HBM3堆栈为1024位),显存速率可达5.1Gbps,意味着最大吞吐量为7.8TB/s,是H100 SM3的两倍多。由于大型语言模型训练需要更大的缓冲区和更高的带宽,所以更大的显存肯定会对运算有所影响。

    据了解,H100 NVL计算加速卡的功耗略高于H100 PCIe(350W)的两倍或以上,在700W至800W之间。英伟达计划在今年下半年推出H100 NVL计算加速卡,不过暂时没有进一步提供任何的细节。

    ×
    热门文章
    1铭瑄iCraft B760M CROSS主板评测:瑷珈主题,可爱度爆表
    2酷冷至尊推出全新AI竞彩导热膏:为DIY带来新趣味与个性化选择
    32024年4月中国大陆显卡出货量:华硕逆势增长重回第二
    4技嘉推出钛金雕板卡:出色性能与奢华白金的融合,展现美感和性能的高峰
    5UL揭示8年GPU性能发展历程:平均性能提高1.8倍,未来需要更大压力的测试
    6DSCC创始人曝料,13寸M4 iPad Pro的屏幕订单量是Surface Pro的23倍
    7英伟达GeForce Game Ready 555.85 WHQL驱动:为《F1 24》等新游戏优化
    8影驰推出RTX 4070 SUPER/Ti SUPER Classic显卡,双槽涡轮散热设计
    9PowerToys引入AI粘贴功能,可理解剪贴板内容并进行输出
    已有 3 条评论,共 16 人参与。
    登录快速注册 后发表评论
    • 吕嘉俭编辑 2023-03-22 21:28    |  加入黑名单

      超能康猩猩 一代宗师

      7.8GB/s……
      这速度堪比某些固态硬盘了,是7.8TB/s吧
      2023-03-22 21:09 已有1次举报
    • 支持(2)  |   反对(0)  |   举报  |   回复
    • 谢谢指正,已改。

      已有1次举报

      支持(2)  |   反对(0)  |   举报  |   回复

      3#

    • 超能康猩猩一代宗师 2023-03-22 21:09    |  加入黑名单

      7.8GB/s……
      这速度堪比某些固态硬盘了,是7.8TB/s吧

      已有1次举报

      支持(2)  |   反对(0)  |   举报  |   回复

      2#

    • 12345jv v ji教授 2023-03-22 17:03    |  加入黑名单

      这是为了绕过制裁推出的系列吧

      已有1次举报

      支持(4)  |   反对(2)  |   举报  |   回复

      1#

    提示:本页有 3 个评论因未通过审核而被隐藏

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明