E X P
正努力加载中…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    NVIDIA今年会推出新一代Pascal显卡,最快4月份的GTC 2016大会上就能见到面向高性能服务器市场的Tesla版GP100核心显卡。只不过NVIDIA这次的保密工作做到太好了,除了官方公布过的3D显存、FinFET工艺之外,Pascal显卡的规格还是非常神秘。还好NVIDIA功亏一篑,日前曝光的一份文档中显示Pascal显卡配备的3D显存带宽高达1024GB/s,单精度浮点性能12TFLOPS,双精度浮点性能4TFLOPS,是GK110核心的三倍之多。

    3DCenter论坛有网友找到了NVIDIA公司CUDA院士Manuel Ujaldon去年6月份发布的一份演讲文档,他本身也是西班牙大学教授,这份文档里对比了Intel、AMD及NVIDIA公司不同处理器、显卡的带宽及计算性能,我们来看最关键的Pascal与Teslak K20X的对比。

    K20X使用的是GK110核心,14组SMX单元,2688个CUDA核心,384bit位宽,带宽25GB/s,单精度浮点性能3.95TFLOPS,双精度浮点性能1.31TFLOPS。Pascal显卡规格没提,但应该是GP100核心,配备3D显存,带宽1024GB/s,单精度浮点性能12TFLOPS,双精度浮点性能4TFLOPS。

    GK110与Pascal之间隔了Maxwell架构,不过Maxwell显卡之所以高效,很大一部分原因是阉割了双精度单元,所以在这一点上它实际上连GK110核心都不如,这可能是GM200核心没有加入对比的原因。

    只看GK110与Pascal的GP100核心,GP100的性能是GK110核心的三倍,单精度及双精度差不多都是这样。虽然缺少与GM200核心的直接对比,但GM200核心的Tesla M40单精度性能是7TFLOPS,以此计算的话GP100性能依然是GM200核心的1.7倍,也就是性能提升了70%。


    不同处理器/显卡的带宽性能比

    从三倍GK110性能来看,GP100核心的规模也一定很庞大,所以之前传闻的6144个CUDA核心、170亿晶体管以及600mm2核心面积的传闻还是有一定可信度的。

    值得一提的是,Pascal显卡使用HBM显存几乎是板上钉钉了,而且1024GB/s的带宽也正好与HBM 2显存特性相符,但Manuel Ujaldon这篇文章中除了一个列表提到HBM显存之外,大部分篇幅都是在讲HBM对手HMC显存的,这也是一种3D堆栈内存技术,但HMC 1.0显存的带宽与规格跟1024GB/s的带宽也不符,实在是猜不透这里面到底是怎么回事。

    考虑到这篇演讲是去年6月份的了,并不是最新资料,所以内容仅供参考,GP100核心的性能基本没跑了,至于3D显存到底是HBM还是HMC,笔者还是倾向于HBM 2,毕竟HBM的商业化程度比HMC高多了。

    ×
    已有 13 条评论,共 34 人参与。
    登录快速注册 后发表评论
    • 游客  2016-02-28 00:58

      什么时候CPU集成的核显能达到这一水平?

      支持(0)  |   反对(0)  |   举报  |   回复

      13#

    • 游客  2016-02-22 19:41

      游客

      NVIDIA自爆?
      核弹自爆谁最强 , 美国加州找老黄
      2016-02-19 16:07
    • 支持(4)  |   反对(0)  |   举报  |   回复
    • 自爆技术哪家强?美国加州找老黄!

      支持(7)  |   反对(0)  |   举报  |   回复

      12#

    • 游客  2016-02-19 16:07

      NVIDIA自爆?
      核弹自爆谁最强 , 美国加州找老黄

      支持(4)  |   反对(0)  |   举报  |   回复

      11#

    • 游客  2016-02-19 10:50

      游客

      就这点提升是要被北极星暴打了
      2016-02-18 14:47
    • 支持(0)  |   反对(2)  |   举报  |   回复
    • 双精度不提,单精度提升3倍,可想而知游戏性能有多强悍,基本可以肯定X2出来就像上一代一样就是个大悲剧,北极星还是一如既往被吊打的命。

      支持(0)  |   反对(0)  |   举报  |   回复

      10#

    • 游客  2016-02-18 18:06

      游客

      就这点提升是要被北极星暴打了
      2016-02-18 14:47
    • 支持(0)  |   反对(2)  |   举报  |   回复
    • 暴打不至于,但确实感觉提升的没有想象中那么高,说到单精度计算速度,FURY X2就已经达到12TB/S了,北极星要达到这个水平应该也不是问题,只不过A卡向来计算能力领先N卡一大截但游戏性能却没有优势。

      支持(4)  |   反对(0)  |   举报  |   回复

      9#

    • libossking博士 2016-02-18 15:04    |  加入黑名单

      钱早就准备好了,你倒是快出啊

      支持(1)  |   反对(0)  |   举报  |   回复

      8#

    • 游客  2016-02-18 14:51

      GK110 5.11TFLOPS,有3倍?

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • 游客  2016-02-18 14:47

      就这点提升是要被北极星暴打了

      支持(0)  |   反对(2)  |   举报  |   回复

      6#

    • 游客  2016-02-18 14:45

      隐约感觉帕斯卡完整核心就是个怪物,A社的杀手锏也来爆掉猛料吧

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 好人一生蛋疼教授 2016-02-18 13:07    |  加入黑名单

      中低端GDDR5X还算数吗?

      支持(2)  |   反对(0)  |   举报  |   回复

      4#

    • 游客  2016-02-18 13:01

      确定帕斯卡使用的是HBM显存?

      支持(0)  |   反对(0)  |   举报  |   回复

      3#

    • 游客  2016-02-18 12:22

      秒天秒地,秒掉太阳系 盒蛋加油,

      支持(1)  |   反对(0)  |   举报  |   回复

      2#

    • 游客  2016-02-18 11:25

      新的PPT已经出现

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明
    为你推荐