E X P

  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

      在看过了Tegra处理器的路线图之后,我们再来看看GTC 2013大会上公布的GPU路线图。在此之前我们只知道2013年依然是Kepler架构,不过核心会从去年的GK104变成现在的GK110,再下一代就是原本预计在2013年发布的Maxwell麦克斯韦尔,现在推到了2014年。NVIDIA现在又给出了Maxwell的继任者—— Alessandro Volta(亚历山德罗·伏特,维基链接),他是一位意大利物理学家,电池的发明者。

      现在Volta还只是一个代号,详细的架构信息不得而知,不过NVIDIA此次公布的路线图中给出了每代GPU架构的技术进步,我们可以从中一窥Volta的设计。

      Volta的特点是集成了堆栈式内存(Stacked DRAM),这意味着DRAM电路与GPU核心非常接近,二者通过TSVs(using through-silicon vias,硅通孔)技术连接起来。高带宽的板载DRAM设计并非什么新技术,但是这个设计依然非常独特。

      以往的一个例子是索尼的PS Vita,它的GPU就有128MB的RAM内存,不过并没有使用TSVs设计。Intel的Haswell处理器中新增了GT3级别的核心,还记得以前的新闻吗,GT3核心就具备128MB的嵌入式缓存。

      使用堆栈式内存设计的好处不仅在于极大地提高了带宽,而且延迟也会很低,相比外置式内存,它在速度及宽度上都有优势,当然具体如何还要看实际配置。如果内存离GPU核心很近,那么好处不仅是带宽高,而且运行频率也可以很高。

      对Volta来说,NVIDIA的目标是为其提供1TB/s的带宽,这个数据是目前带宽最高的GTX Titan的3倍,后者使用的是384bit位宽,1502MHz的GDDR5显存,带宽也只有288GB/s,那么Volta有可能搭配的是1024bit位宽、速率8Gbps,也有可能是2048bit位宽、4Gbps速率,现在来看实现的难度颇大,不过Volta依然有好几年的时间才能面世,技术进步的速度谁又能说清呢。

      更让人感兴趣的是NVIDIA如何解决芯载DRAM的容量问题。目前的DRAM(面积)还是相当大的,特别是GDDR显存,显卡要想完全使用这种设计不太可能,因为目前的消费级显卡的显存容量已经达到了6GB。

      NVIDIA更可能的做法是使用分离式DRAM设计,芯片内集成的DRAM主要用作缓存及共享内存的交换池(pool),而外部总线依然会搭配大容量显存,虽然速度会比堆栈式集成的慢一些。

      Volta在NVIDIA的路线图时并没有时间表,因此我们不知道它什么时候才能发布。Maxwell原本预计在2013年发布,但是也推迟到明年了,Kepler原本也是在2011年发布的,结果也是在去年才发布。虽然NVIDIA没有说明为什么,但是看起来NVIDIA的产品还是与TSMC的工艺紧密连接在一起,发布新架构时往往需要使用新工艺,Volta的开发需要搭载某个特定的工艺,只不过目前这一切都是未知数。

      TSMC还在努力追赶制程工艺最先进的Intel,不过很难预计未来会发生什么,所以(Volta)缺少时间表一点也不奇怪。NVIDIA在演讲中提到了他们会在未来的Parker SoC(Logan之后的Tegra处理器,蜘蛛侠名字)处理器上使用FinFET(鳍式晶体管,也就是3D晶体管)工艺,但是没有提到Volta也会使用FinFET工艺,因此具体如何还真不好说。

      NVIDIA也给出了有关Volta GPU性能的粗略估计,以单位瓦特的FP64双精度性能为例,K20X大约是5.5GFLOPS/W,Volta大约是24ish,由于NVIDIA还要考虑功耗因素,因此同等TDP下我们可以认为Volta的性能是K20X的四倍左右,其FP64双精度性能大约在5TFLOPS左右。当然,现在的估计只是一个早期预测,Volta离问世还有段距离。

      最后,Volta作为最新披露的GPU架构成功吸引住了媒体的眼光,以致于很多人都忽略了Maxwell的存在。Maxwell的设计要点其实也值得一看,它将是NVIDIA第一个使用“统一虚拟寻址(unified virtual address)”技术的GPU架构,这种设计对同时集成CPU和GPU的设备也非常重要,AMD的HSA异构计算要解决的一个问题就是统一寻址问题。

      还有Parker SoC处理器的问题,这是Logan(Tegra 5)之后的处理器代号,它将使用Maxwell架构,CPU架构则是Denver,NVIDIA的Project Denver就是为GPU开发基于ARM指令的CPU核心,意味着Parker及类似的处理器已经可以集成NVIDIA自己的CPU核心了。

     

    ×
    热门文章
    1将Windows 11安装在英特尔Pentium 4平台,单核处理器也能跑
    2乔思伯推出D30/D40系列,功能齐全的紧凑型桌面机箱
    3游戏基准测试再次印证英特尔酷睿i9-12900H规格,14核心20线程
    4Google Pixel 6/6 Pro到来:自研Tensor芯片+最高120Hz屏幕,售价599美元起
    5SK海力士推出全球首款HBM3内存,单颗容量24GB,带宽达到819GB/s
    6微软Xbox迷你冰箱开启预订后瞬间售罄,黄牛蜂拥而至
    7美商海盗船中国区首发K100璀璨金特别版,致敬中国电竞的黄金时代
    8美商海盗船推出全新ELITE LCD一体式水冷散热器,配备2.1英寸IPS LCD屏幕
    9基于Arm架构的芯片已出货超过2000亿颗,定义移动和嵌入式市场
    已有 11 条评论,共 27 人参与。
    登录快速注册 后发表评论
    • 游客  2013-06-01 08:34

      该评论年代久远,荒废失修,暂不可见。

      支持(2)  |   反对(0)  |   举报  |   回复

      11#

    • 游客  2013-03-22 23:23

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      10#

    • 游客  2013-03-21 07:43

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      9#

    • 游客  2013-03-21 06:59

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(1)  |   举报  |   回复

      8#

    • 游客  2013-03-20 18:14

      该评论年代久远,荒废失修,暂不可见。

      支持(3)  |   反对(0)  |   举报  |   回复

      7#

    • 游客  2013-03-20 16:59

      该评论年代久远,荒废失修,暂不可见。

      支持(3)  |   反对(0)  |   举报  |   回复

      6#

    • 游客  2013-03-20 12:55

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      5#

    • 游客  2013-03-20 11:31

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      4#

    • 游客  2013-03-20 11:16

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(5)  |   举报  |   回复

      3#

    • 我匿名了  2013-03-20 10:53

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • 游客  2013-03-20 10:53

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明
    为你推荐