E X P

  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...
      GTX680是NVIDIA全新GPU架构Kepler的桌面顶级图形核心,这颗芯片凝聚了NVIDIA多年来的设计研发实力,同时GTX680也对刚换用新图形架构的AMD Radeon南岛家族显卡做出正面回应。

      作为全新架构的首位承载者,我们看到GTX680编号可能会误认为这是新架构的顶级产品,其实顶级核心代号GK110尚未诞生,而GTX680采用GK104芯片是专为图形游戏应用设计的性能型产品,它在性能、功耗、发热等多个方面追求平衡,最终将GPU核心与显卡的可制造性提升到新高度。

      流言蜚语应该终结了,与对手真刀真枪决战的时候到了。

      自从发布GCN架构的南岛家族显卡之后,AMD一直沐浴在胜利的光环之中,HD 7970显卡不论在3D游戏还是NVIDIA引以为傲的通用计算上都是大跃进一般的提升,而28nm工艺带来的功耗控制以及超频能力也着实让人吃惊,首发优势让AMD占尽上风。

      整个DX11时代,AMD往往占有先发优势,但后发的NVIDIA也能成功翻盘,比如GTX 480 vs HD 5870、GTX 580 vs HD 6970。如今HD 7970当道,NVIDIA的Kepler时隔三个月之后终于追上来了(HD 7970于去年12月22日发布,正好是三个月间隔),期待已久的大战终于开始了。


    GTX 680:决一死战吧,我的宿敌,Radeon君!

      战鼓已经响起,来吧,HD 7970,你已经享受了三个月的美好时光,在你的辉映下我的兄弟GTX 580黯淡无光,功耗更被揭了老底,但是你真正的对手是我,现在的我已经今非昔比,战争才刚刚开始,我要夺回属于我的王者之位!

      目前双方选手已经就位,一方是现在洋洋得意的胜利者,一方是卧薪尝胆归来的复仇者和它受气的小弟,下面来看一下这三位选手的具体情况。

      需要注意的是,GTX 680是否支持DX11.1存疑,虽然0.6.0版GPU-Z显示它支持DX11.1(它同时也把GTX 680识别为PCI-E 2.0 x16带宽),但是NVIDIA的驱动控制面板的信息中依然显示DX11,而且官方文档中似乎也没提及DX11.1支持,因此我们更倾向于GTX 680不支持DX11.1。(看来跟DX10.1一样要跟AMD对着干到底)。

      与GTX 580相比,GTX 680的CUDA核心数高出2倍,总计有1536个,纹理单元也翻倍达到128个,ROP单元则减少到32个,低于GTX 580的48个。规格同样有所精简的还有显存位宽,从384bit降到256bit,但是GTX 680的显存频率达到1502MHz,一举超过AMD的1375MHz,显存总带宽也有192GB/s,比GTX 580还要高一点,不过跟384bit的HD 7970还有一定距离。

      GTX 680最明显的改进是在功耗和核心面积上,后者只有区区294mm2,大大低于GTX 580的520mm2,也低于HD 7970的365mm2,甚至比当前的GF114核心的360mm2还要低很多。TDP更是只有195W,秒杀HD 7970的210W、GTX 580的244W,绝对是NVIDIA自GT200架构以来面积最小、功耗最低的顶级卡核心

      GTX 680一改我们平时对NVIDIA显卡的认识,这还是个高性能、高发热的N卡吗?究竟它背后发生了怎样的变化,CUDA核心连升三级、功耗反而更低,现在就来揭开Kepler的架构之谜吧。

    ◆ Kepler架构解析:3倍核心是怎样练成的

      早前在分析Kepler的架构的文章中,我们就提出了GK104架构像GF100还是像GF114的问题,网上甚至有人根据GK104那1536个CUDA核心的规格PS出了GK104的架构,当然最终的结果是GK104更像GF114那样,GPC和SM单元数量减少,但是每组SM单元容纳的CUDA核心更多。


    GF110架构图

      GF110有为4组GPC,每组下辖4组SM单元,每组SM单元又有32个CUDA核心,总计有512个CUDA核心,64个纹理单元,48个ROP单元,16个曲面细分单元,搭配6组64bit显存控制器,总计384bit位宽,1536MB显存。


    GF114架构

      GF114架构中只有2组GPC单元,SM单元数量也从16组减少到8组,但是每组SM单元的CUDA核心数提高到48个,内存控制器减少到4组,总位宽256bit,曲面细分单元也减少到8组,但是纹理单元依然维持在64个,ROP单元也有32个。

      通过这些优化,GF114架构的核心面积大幅减少,而性能也没有因为规格大减而损失多少。


    GK104的核心透视图

      NVIDIA给出的GK104核心透视图上可以清晰地看到它有8组SM单元,架构上跟GF114更为相似。


    GK104架构图

      从这张图上可以看到GK104有四组GPC单元,每组又由2组SM单元组成---准确来说是SMX单元,NVIDIA对SM的称呼有所变化。

      现在来对比一下GF110、GF114以及GK104架构中的SM/SMX单元变化。


    GF110 SM单元(左)、GF114 SM单元(中)以及GK104 SMX单元(右)对比(点击放大)

      GF110的SM单元有32个CUDA内核,四个SFU单元,16个LD/ST存储单元,64KB L1本地缓存,每组SM单元有4组纹理单元,总计64个纹理单元。另外每组SM还有一个多边形引擎负责曲面细分计算。

      GF114的GPC和SM单元总数砍掉一半,SM还剩8组,但是每组容纳的CUDA内核数增加到48个,SFU单元增加到8个,LD/ST也增加到32个,相应地Dispatch单元也增加了一组,L1缓存依然为64KB,不过纹理单元增加到8个,总数依然维持在64个,不过此时的多边形引擎也没有变化。

      GK104的SMX单元中,NVIDIA大手笔集成了192个CUDA核心,纹理单元也增加到16组,前端渲染单元也增加到四组,同时SFU以及LD/ST单元也是水涨船高,增加到32组,纹理单元再次翻倍,8组SMX单元总计有1536个流处理器、128个纹理单元以及32个ROP单元。


    GK104与GF110规格对比


    每组SM/SMX单元性能对比

      更主要的是内在的变化,从Kepler开始,NVIDIA以往坚持的Core:Shader=1:2的分频模式已经没有了,以前采用这种方式是因为核心频率不能大幅提高,为了提高性能就必须让CUDA的核心频率增加一倍,但是这也意味着更高的能耗。

      GTX 680中NVIDIA将SMX单元中的CUDA核心数提高至原来的3倍,而且核心频率也达到1GHz以上,不再需要Shader异步了,二者将同频运行,有助于降低显卡功耗,因此GTX 680在CUDA数量暴增的同时功耗更低,而每瓦性能比更是提高了一倍。

      还有一个变化就是Polygon多边形引擎升级到2.0,虽然物理单元结构没有变化,但是Kepler的PolyMorph Engines 2.0的每周期性能是GTX 580的两倍多,再加上1006MHz的频率也要比GTX 580高出30%,因此整体性能反而会更强。即便与对手HD 7970相比,NVIDIA宣称GTX 680的曲面细分性能要比后者快4倍。

    ◆ GPU Boost:GPU加速我也行

      Intel和AMD各自为旗下的CPU开发了动态超频技术,简单来说就是在CPU功耗没有达到TDP设定值之前提高CPU频率,视多个内核的负载程度不等也会有不同的频率提升。比如测试用的Core i7-2600K,默认频率为3.4GHz,四核运行最高可以加速到3.5GHz,双核负载下可以加速到3.6GHz,单核应用时最高可以加速到3.8GHz。


    Kepler架构的显卡没有Shader频率,但是多了Boost频率

      现在Kepler显卡也有了类似的动态超频技术,它的技术原理跟CPU相似,在TDP范围内提供更高频率。如上图所示,GTX 680的核心默认频率为1006MHz,Boost频率为1059MHz,高了53MHz。


    Kepler显卡的动态加速技术原理

      一般来说,除了Furmark、OCCT这样的拷机测试中很少有游戏或者测试能使GPU达到全负荷运行的,即便GPU-Z显示百分百的GPU占用也不意味着GPU到顶了。在TDP功耗未到上限时,显卡的BIOS会自动提升核心频率,负载越低可提升的空间就越大,一旦功耗达到TDP值,那么频率也会自动降至标准范围,然后再进入下一个循环。


    3DMark 11负载中GPU加速就会不断调整频率


      这张图就是在3DMark 11的测试中不同的截图拼接起来的,默认的频率为1006MHz,但是运行过程中频率会上升到1045、1058MHz,最高达到1084MHz,比显示的Boost频率还要高。

      此外,GPU Boost在显卡超频的时候依然不会失效,因为NVIDIA设定的默认频率与Boost频率是有一个固定比率的,具体数值大约是1.058,也就是说你超频到1.2GHz,还是会存在一个1.2GHz*1.058=1.27GHz的Boost频率。

    ◆ Bindless Texture:纹理操作不再受限

      Fermi及当前的DX11显卡在读取纹理数据时需要先分配一个“槽”(slot),它位于有着固定大小的binding Table表中。每个shader每周期可以读取的纹理数据基本上取决于slot的数量多少,在DX11 API规范中,每个shader最多只可以同时操作128个纹理数据。


    目前的显卡的纹理操作有总数限制

      Kepler显卡支持Bindless Textures(无束纹理)技术,此时进行纹理数据操作就不需要上面那个多余的步骤了,shader可以直接从显存中读取纹理数据,而且没有数量限制,一个场景内甚至可以有一百万个独一无二的纹理存在。

      另外,使用Bindless Textures除了可以大幅提高纹理的数量,还有一个好处就是可以减少CPU占用率。

      目前Bindless Textures还只应用OpenGL规范中,未来可以通过NVAPI间接实现DX API支持Bindless Textures,后续的DX版本也可能支持直接这一技术。

    ◆ 自适应性同步:游戏更流畅

      游戏里的同步技术,特别是垂直同步技术让人又爱又恨,开启它可以防止画面撕裂,但是很多场合它又会限制帧数导致游戏有卡顿的感觉。


    开启垂直同步,部分场景帧数觉剧降而造成卡顿的感觉


    关闭垂直同步,部分场景又可能存在画面撕裂的可能

      为了解决这种"前怕狼后怕虎"的矛盾,NVIDIA提出了Adaptive VSync(自适应同步)技术,它可以让驱动程序自主决定垂直同步开关与否,避免出现上面的尴尬。


    NVIDAI的Adaptive VSync可以减缓垂直同步开关带来的影响

      当游戏帧数低于60fps时,Adaptive VSync会自动关闭垂直同步以防止帧数卡顿,而当游戏帧数恢复到60fps左右时,垂直同步会再次打开以降低可能的画面撕裂。


    新的300系列驱动已经集成了Adaptive VSync选项

      好消息是NVIDIA的新一代300系列驱动中已经集成了Adaptive VSync选项,而且并非Kepler显卡专属,GTX 400、GTX 500显卡也会提供支持。

      驱动提供了两个级别的选项,Adaptive 以及Adaptive(half refresh rate,半刷新率),后者主要用于显卡性能不强、帧数处于20-50fps之间的情况,此时垂直同步的帧数会锁定在30fps而非通常的60fps。

    ◆ FXAA与TXAA:画质更高,速度更快

      目前显卡的抗锯齿(AA)大都集中在后期处理AA而非传统的硬件AA,后者的典型代表是MSAA(多重采样抗锯齿),不过它的资源消耗很高,性能损失比较大。后期处理AA技术主要有NVIDIA开发的FXAA、AMD发扬光大的MLAA以及SQAA等。

      伴随Kepler显卡的推出,NVIDIA除了继续改善FXAA性能之外,还提出了一种新的名为TXAA的新技术。

    FXAA已经集成到驱动面板中

      此番展示FXAA的Demo是EPIC在GDC 2012展会上公布的Samaritan demo,这款demo实际上是去年就发布了,不过现在展示的demo增加了FXAA支持。

      
    FXAA与4xMSAA画质对比(点击放大)


    No AA与FXAA画质对比(点击放大)

      以上是Samaritan demo中的FXAA与No AA、4xMSAA的画质对比,结合我们之前多次测过的FXAA性能来看,它确实很有发展潜力,画质与4x MSAA相当,但是速度要快得多。


    300系列驱动开始也集成了FXAA选项

      目前的300系列驱动也很贴心地集成了FXAA选项,终于可以不用在四处找游戏的FXAA补丁了,不过需要注意的是已经支持FXAA的游戏如《蝙蝠侠》、《战地3》、《上古卷轴5》这个选项是不能开启的,《Far Cry 2》这样原本不支持FXAA的倒是可以开启。

      另外,FXAA也不是一成不变的,从《柯南时代》最早应用以来,已经发展出偏重画质的FXAA 1、FXAA 2以及侧重速度的FXAA 3等多个级别,目前的游戏支持的FXAA主要是FXAA 1或者速度更快的FXAA 3,而驱动中提供的FXAA介于FXAA 1和FXAA 3之间,画质比FXAA 3更高,不过速度比FXAA 3要低一些。

    TXAA投石问路

      TXAA是伴随Kepler显卡问世的新型AA,它是工业电影使用的AA技术,可以充分利用Kepler的FP16纹理性能。TXAA混合了硬件MSAA、CG电影AA的优点,而2x TXAA会有更高的画质。

      构成TXAA的基础是一种高画质过滤器(resolve filter),主要用在后期处理中进行HDR纠正。

      以下三张是8x MSAA、No AA以及TXAA的画质对比图,点击放大。

      TXAA有两种主要类型,TXAA 1和TXAA 2,前者的画质相当于8x MSAA而速度可与2x MSAA相媲美,而TXAA 2的画质要高于8x MSAA,但是速度相当于4x MSAA。

      现在的游戏还不支持TXAA,不过今年晚些时候发布的游戏和引擎如MechWarrior Online、Secret World、 Eve Online、Borderlands 2,、Unreal 4 Engine、 BitSquid、 Slant Six Games以及 Crytek将会支持TXAA,未来更希望TXAA也能像FXAA那样集成到驱动面板中。

    ◆ 编码专用单元,全新3+1屏幕组合

      与HD 7970一样,Kepler显卡也支持最新的多种显示技术规范,比如4K分辨率、3GHz HDMI,multi-stream audio多音频流,并改进了视频转码性能。

    NVENC编码加速单元

      视频编码加速是最具实用性的GPU加速技术之一,之前NVIDIA的显卡使用的大都是基于CUDA加速的方案,虽然CUDA转码速度快,但是存在大材小用、浪费功耗的问题。在Kepler身上,NVIDIA又增加了全新的专用编码单元以大幅提升编码速度。

      Kepler设计了专门的转码单元,整体概念类似Intel SNB架构中的Quick sync转码单元,它支持H.264规范,编码速度比使用CUDA加速要快3倍。此外,软件可以自己选择使用CUDA加速还是使用这个专用转码单元,或者同时使用这两种加速方法。

    NVENC主要特性

    1:以8x或更高的实时比例编码1080p视频,比如16分钟时长、30fps的1080p视频重编码时间只需要2分钟时间。

    2.支持H.264 Base, Main, and High Profile Level 4.1规范。

    3.支持蓝光3D使用的MVC立体视频。

    4.支持4K分辨率。

       目前NVIDIA主要通过授权API、提供SDK的方式推广NVENC编码,现在支持NVENC编码的主要是新版本MediaEspresso软件,后面我们也有专门的转码测试。

    单卡支持3D Vision Surround模式

      目前NVIDIA的显卡要想实现3D Vision Surround至少需要2张卡SLI,相比AMD的宽域多屏技术不够灵活。随着Kepler的发布,NVIDAI也终于实现了单卡实现3D Vision Surround了。

    3+1多屏组合

      另一个重要的改进就是多屏输出,GTX 680的接口中有2个双链DVI、1个HDMI以及1个DP,其中前三个接口可以组建三屏模式,余下的DP接口还可以再接一个显示器组成3+1多屏模式,下面的三个显示器可以玩游戏,而上面的显示器可以用来聊天、收发邮件之类的工作。


    多屏模式下可以将任务栏放置在中间的显示器底部


    边框修正以及边框Peak

      多屏游戏有个恼人的问题就是显示器边框会遮挡游戏内容,Kepler支持边框修正,可以将遮挡的部分显示出来。还有就是边框Peak,使用快捷键调出被隐藏的界面。


    我们也初步体验了一下GTX 680的单卡三屏

      我们也尝试了GTX 680的三屏模式,单卡确实可以组建5760超大分辨率屏幕,不过这次时间紧迫,显卡周转的频繁,没能深入体验,以后还会有更详细的体验文章。

    ◆ 公版GTX 680外观赏


    NVIDIA GTX 680显卡

      在其他高端卡忙着增重增长的同时,GTX 680给人的感觉是变秀气了,PCB长度减少到25cm,820g的重量也要低于GTX 580的890g,更低于HD 7970的1010g。


    这个角度也能看出GTX 680确实变短了


    边缘位置印的logo也比前代更明显


    独特的6pin排列方式

      GTX 680的供电接口不仅从GTX 580的8pin+6pin“简化”到双6pin,而且这两个6pin接口的排列方式也不再是平行的,而是上下叠加,方式很新颖。有人觉得这种排列方式更节省空间,不过我觉得跟传统的双6pin排列是一样的。

      至于有人担心因为两个接口相对排列而带来接口不易插拔的问题,使用中并没发现这个困扰,这两个接口错开了一定位置,只要先拔上面的接口就不会有问题。


    视频输出接口

      接口方面,之前NVIDIA公版卡的标准搭配是双链DVI+mini HDMI,GTX 680除了双链DVI之外,还提供了HDMI以及DP,虽然接口数量上还比不过HD 7970,好歹也进步了许多。

      另外,GTX 680单卡支持三屏输出,使用DP接口的话还可以组建4+1方式的多屏。

    ◆ 公版GTX 680散热器拆解

      在GTX 580甚至之前的GTX 480,NVIDIA显卡的功耗和发热比较高,公版散热器的表现只能用高温高噪音来形容,以致于NVIDIA动用了硬件监控电路以强制降低显卡功耗。

      GTX 680的TDP只有195W,核心也只有294mm2,这两项指标甚至比HD 7970还要优秀,散热器终于有翻身的机会了。


    官方的资料称GTX 680的散热器为静音设计


    散热器主体

      散热器的主要架构跟之前的GTX 580相比其实没有太大变化,依然是涡轮风扇、铝质鳍片、导风罩以及辅助钢板。


    拆掉导风罩后的样子
     


    散热器的三大组件


    铝质鳍片+均热板,唯一的变化是底部也没有凸起了


    钢板覆盖了大部分PCB面积,可以起到辅助散热的作用


    涡轮风扇,上面没找到标签,,只知道是酷冷代工,看不到具体的信息,实测发现声音并不吵

      虽然NVIDIA宣称新散热器的效果如何好,不过对比了之前GTX 580的公版散热器,二者的结构大同小异,散热器的静音主要应该是受惠于GTX 680的功耗大幅降低。

    GTX 680 PCB与GTX 580对比


    NVIDIA GTX 680与GTX 580 正面PCB对比(点击放大)

      与前辈GTX 580的PCB相比,GTX 680的长度只有25cm(10英寸),比GTX 580以及HD 7970的26.7cm(10.5英寸),这也是近几年来旗舰级显卡首次缩短PCB。

      GTX 680的GK104核心面积显著缩小,已经用不着GF100那样的金属盖来加强散热了,二者差异明显。另外,GTX 680是2GB显存,核心周围只布置了8颗显存,而GTX 580是1536MB,但是显存颗粒有12颗,排列的比GTX 680要紧密。

      右侧的供电电路部分,GTX 680由GTX 580的6+2相减少到4+2相,核心部分的四相供电元件也倾斜90度变成横向排列了。


    NVIDIA GTX 680与GTX 580 背部PCB对比(点击放大)

      这是二者背部PCB的对比,GTX 680的核心处滤波电容要少几颗,整体的感觉就是GTX 680更“简洁、光滑”一些,不像顶级卡的风格啊。

      核心编号为GK104-400,A2步进,台积电TSMC 28nm工艺制造,长宽分别为18.7mm、16.8mm,表面积为314mm2,实际核心面积为294mm2,看来之前那位用PS计算出GTX 680面积为320mm2的同学算的还蛮准的。


    显存颗粒来自Hynix

      显存颗粒也是来自Hynix,编号H5GQ2H24MFR,单颗32bit位宽,2Gb容量,跟HD 7970使用的是一样的,R0C后缀表明其频率为6GHz,实际运行频率为1502MHz,远远高于Fermi时代NVIDIA显卡的显存运行频率,要知道GTX 580才是1002MHz(等效4008MHz)。


    4+2相供电

      GTX 680的功耗以及核心面积大降,因此供电电路要求也没这么高了。公版标配只有4+2相,4相为GPU主供电,2相为显存供电。从图中可以看到有1相是虚焊的,之前泄露的PCB上显示是5+2相供电的。


    供电PWM芯片

      供电PWM芯片为RT8802A,台湾立琦公司出品,支持2/3/4/5相供电自动管理。

      核心的4相使用了立隆固态电容、R22贴片电感以及1上2下MOSFET,上桥为4939N,下桥为两颗4935N,安森美出品,Super SO-8封装。


    显存2相供电

      显存的2相独立供电使用的是ECR12固态电容、eR33电感以及1上1下MOSFET,上桥为MDU1514,下桥为MDU1516,韩国Magna公司出品,PowerDFN56封装。

      总的来看,GTX 680作为一款售价4000元的显卡,PCB做工与用料真的一般般,很多几百元显卡的用料都比它还好,NVIDIA真是省到家了。当然,我们也不是唯用料论,供电的简化说明显卡的要求更低了,这对消费者来说是好事。对用料要求较高的玩家只能等待厂商的各种超公版了。

    ◆ 影驰GTX 680赏析


    影驰GTX 680表面没有花哨的贴纸,只在左上角有个影驰的logo


    接口也是公版的四个数字输出接口


    摄影师henery出境了


    PCB背面


    显卡包装

    ◆ 索泰GTX 680赏析


    索泰GTX 680也是公版设计,换了索泰风格的黄色贴纸


    显卡包装不同于索泰以往的风格,有点小清新

    ◆ 昂达GTX 680典范版赏析


    昂达GTX 680显卡


    输出接口


    散热器


    PCB供电设计


    GK104-400核心


    Hynix的GDDR5颗粒


    显卡包装

    ◆ 映众GTX 680赏析


    映众GTX 680游戏高手显卡


    映众是唯一一个换了PCB颜色的,虽然也是公版设计,但是PCB是映众自己生产的


    也是RT8802A PWM芯片,表明它也是公版设计


    显卡包装

    ◆ 耕昇GTX 680关羽版赏析


    耕昇GTX 680关羽版


    显卡包装


    显卡包装及附件

    ◆ 北影GTX 680赏析


    北影也在第一时间推出了自家的GTX 680显卡
     

    ◆ 华硕GTX 680赏析

    ◆ 微星GTX 680图赏

    ◆ 测试平台图赏

      测试平台为Core i7-2600K,1.4V电压下超频到4.8GHz,内存为四条芝奇DDR3 1600,总容量16GB,散热器为Super Mega,搭配12cm静音风扇。


    测试平台(点击放大)


    另一角度

      为了统一日后的温度测试,机箱将固定为振华SF-1000,开启2个前置风扇,后置风扇以及顶置的20cm风扇。


    振华SF-600P14PE电源

      随着NVIDIA显卡功耗的大幅下降,测试根本就不需要再搭配800W或者1000W的电源了,600W金牌电源即可,不过这款电源是非模组化设计,理线麻烦了点。


    测试对比了GTX 580GTX 680以及HD 7970三款显卡


    从这个角度可以看到GTX 680是最小巧的


    实际上GTX 580和HD 7970的PCB是一样长的,不过HD 7970的导风罩更长,显得更大

    ◆ 测试平台详细说明

      测试平台配置为Core i7-2600K,并在1.4V电压下稳定超频至4.8GHz(48x100MHz),搭配四条芝奇DDR3 1600 4GB内存,总计16GB,时序为9-9-9-24,对比测试了HD 7970以及GTX 580两款显卡。

      软件平台为Win7 X64 SP1,HD 7970使用12.2 WHQL驱动,GTX 580在功耗以及温度测试时使用的是266.58驱动以破解功耗保护,性能测试时使用最新的296.10 WHQL驱动。GTX 680使用的是300.99 beta驱动。

      测试的主要项目依然分为游戏性能以及计算性能,并做了一些调整,增加了DX11游戏的比重,并针对曲面细分、FXAA做了针对性测试。计算性能测试增加了MediaEspresso转码对比,转码功能比其他的OpenCL测试要实用的多。

    曲面细分性能:GTX 680以少胜多

      进入DX11时代之后,AMD与NVIDIA就曲面细分性能交火不止一次两次了,每次发布新架构显卡都有针对曲面细分所做的改进,AMD称HD 7970上的曲面细分单元已是第九代,数据吞吐能力比HD 6900系列提高4倍多。对NVIDIA来说,Fermi架构每组SM单元有一个多边形单元,总计拥有16个多边形单元,而Kepler有8组SM单元,多边形单元数量减少到8个,但是性能反而更强。

      曲面细分性能测试选择了微软DX11 SDK自带的Sub11测试以及Heaven 3.0,前者功能专一,所以只调整分辨率至2560x1600,后者还要涉及其他DX11特性,所以分辨率为1920x1080,High画质,依次开启四个曲面细分级别。

      纯理论的曲面细分性能中,GTX 680有392.7帧,比GTX 580的227.2帧高了73%,进步明显,不过比HD 7970的475.2帧要低17%。

      曲面细分性能并不能单独独立于DX11特性之外,如果放在实际游戏中,GTX 580从禁用曲面细分到最高级的曲面细分性能损失了40%,HD 7970损失了45%,而GTX 680损失了39%,稍微领先了一点。

      这意味着虽然GTX 680的多边形单元数量减少了一半,但是实际性能比前代还要大幅胜出,理论性能比HD 7970要低一些,一旦综合到DX11特性中差距并不明显。

    ◆ FXAA性能:比GTX 580快一倍

      FXAA的讨论以及测试我们做过了很多,相比大量耗费资源的MSAA,FXAA性能损失更少,速度更快,而画质不相上下。作为FXAA的开发者,NVIDIA对FXAA的支持也不遗余力,300.99驱动面板中已经集成了FXAA开关,可以强制在游戏中使用FXAA。

      FXAA的测试选择了NVIDIA官网的一个类似DX11 SDK的小工具,另外还有游戏《Batman:Arkham City》,后者支持三种级别的FXAA设置,游戏设置在1920x1080分辨率、DX11模式、Very High画质下。

      这个理论性的FXAA测试中GTX 680相比GTX 580优势明显,性能提升了98%,接近一倍,当然比HD 7970要低7帧,二者差距甚微。

      实际游戏中效果更不明显了,在《Batman》游戏中开启FXAA与否对帧数影响很小,GTX 580只损失了4%的性能,HD 7970的性能损失为7.4%,GTX 680损失了3.7%,看来作为技术的提出者NVIDIA显然还是有一点先天优势的。

    ◆ 计算性能:GTX 680喜中带忧

      自从GCN架构也将计算性能作为重点之后,AMD与NVIDIA又多了一个战场,谁又是新的计算性能王者呢?

      MediaEspresso 6.5测试选择的是一段1080p分辨率的VC-1片段转成1280x720p的H.264影片,各自开启相应的硬件加速技术。

      首先是超频到4.8GHz的四核八线程CPU,用时52秒,GTX 580用时40秒,HD 7970用时45秒,到了GTX 680身上用时缩短至32秒,GPU加速性能上GTX 680再次领先。

      Compute Mark测试中GTX 680大幅领先GTX 580,但是对阵HD 7970已经有了败绩,差了300多分。这是测试误差还是软件支持不够好?

      在GPC Benchmark测试中,GTX 680的单精度性能相比GTX 580无悬念地再次胜出,但是与HD 7970相比,单精度运算低了28%,但是双精度以及密码运算上差距悬殊,只有HD 7970的七分之一到三分之一。

      在LuxMark 2.0的测试中,特意选择最复杂的Room室内场景,GTX 680只有278分,不仅大大低于HD 7970的1028分,也没有超过GTX 580的408分。

      GPU计算中还有Sandra 2012的相关测试,结果也类似,GTX 680的单精度性能比GTX 580要强,但是双精度性能上不仅大大低于HD 7970,甚至比GTX 580还要低。

      现在AMD和NVIDIA的位置似乎颠倒了,AMD的显卡在计算性能上发力,而GTX 680反倒退步了。当然,这只是策略的调整,GTX 680只是一款显卡,上一代的Fermi为了计算性能所做的改进比如多级L1、L2缓存都会占据更多的核心面积,但是对游戏来说意义并不大。GTX 680的游戏性能确实更强了,而计算性能并非普通消费者关注的,另外更具实用性的编码加速性能上GTX 680并没有退步。

      高性能HPC已经是NVIDIA的一大重点,如果是针对计算市场的Tesla分支的GTX 680肯定还会加强,只是这个就不在我们的讨论之内了。

    GTX 680 vs GTX 580:游戏性能完胜

      相对GTX 580来说,GTX 680在游戏性能上全面领先,特别是最新的DX11项目中大幅领先,3DMark 11 P和X模式下高出50%还多,其他DX11游戏中如《战地3》、《蝙蝠侠》以及《Crysis 2》中普遍也有20-40%的领先。

      至于计算性能,MediaEspresso转码测试中比GTX 580更快,Compute Mark中也高了54%,不过双精度运算上比GTX 580还要低。

    GTX 680 vs HD 7970:游戏性能小胜,计算失利

      真正的对决来了。

      与AMD阵营的拳头显卡HD 7970相比,GTX 680有好有坏。好的方面是,游戏性能要高一点,而3DMark 11这样的测试中甚至会高20%以上。不过在《Metro 2033》、《Crysis 2》以及《Alien vs Predator》游戏中败给了HD 7970,差距在8-15%左右。

      计算性能上GTX 680没能超越HD 7970,虽然MediaEspresso以及DirectCompute上领先了,但是其他测试中还是大比分落后于HD 7970,毕竟GTX 680不像Fermi那样身兼多职。

      综合下来,GTX 680的游戏性能比HD 7970还是要领先9%左右,NVIDIA再次夺回性能王者,虽然领先优势相比GTX 580对阵HD 6970的时代在缩小。(不知道AMD会不会后悔没把HD 7970的频率定在1GHz以上)。

    ◆ 温度与噪音:公版卡不再是吵闹的代名词

      温度测试封箱进行,机箱为振华SF-1000,开启两个前置12cm风扇、后置12cm风扇以及顶置20cm风扇。这几天气温回升,室温在23-24°C。

      测试状态为待机、3DMark 11图形测试4循环以及1920x1080分辨率Furmark拷机,同时拷机情况下额外增加了HD 7970的电源控制选项,否则驱动会在测试中自动降频。

      注意:功耗和温度测试中GTX 580使用的266.58驱动以破解功耗保护,性能测试部分使用的是最新的296.10驱动。

      待机时GTX 680只有37°C,比HD 7970要低2度,比前辈GTX 580低了5度之多,待机状态下三款显卡都很安静,没有声音。

      3Dmark 11负载下,HD 7970只有73°C,GTX 680有80°C,GTX 580已经升到84°C,同时也声音最吵的,HD 7970也有明显的风扇声,GTX 680转速在2300RPM左右,不过只有轻微的风扇声。

      Furmark拷机下,GTX 580不用说又是温度最高的,转速达到3200转以上,噪音非常明显。HD 7970的拷机温度为80°C,放开电源限制后升到83°C,同时也有明显的风扇运转声。此时GTX 680的温度达到了85°C,比HD 7970要高一点,不过噪音要比HD 7970低,依然只有轻微的风扇声。

      总体来看,除了待机温度之外,公版GTX 680的温度控制比GTX 580有了长足进步,要比HD 7970要差一点,不过噪音控制的很好,甚至可以是几代旗舰显卡中表现最好的,拷机时也只有轻微的风扇声。

    ◆ 功耗:GTX 680翻身,地位逆转

      NVIDIA公布的GTX 680 TDP只有195W,而且GTX 680一改以往高端显卡6pin+8pin的供电接口的传统只使用两个6pin即可(不过供电接口规格高并不意味着功耗就一定高),那么曾经高功耗的N卡真的要变天了吗?

      待机功耗上它与HD 7970相差不大,基本是同一量级,都大大低于GTX 580的126W。

      3DMark 11中GTX 580继续大幅“领先”,HD 7970的整机功耗为249W,GTX 680约为262W,高了13W左右。

      Furmark拷机中GTX 680的331W也要比HD 7970的308W高23W,不过一旦HD 7970剥去电源控制的外衣,其功耗也会大幅增加到361W,这时GTX 680会反败为胜,功耗上要低于HD 7970。

      功耗的改善应该是GTX 680最明显的变化,给人觉得也是最重要的变化。以往测试A卡和N卡的时候,总结时大都是这样,(同级别显卡)N卡性能强,但是发热大、功耗高,A卡性能差一点,但是发热小、功耗低,综合表现好。

      巨核心战略使得NV在GT200以及Fermi两代显卡上付出了相当大的代价,想想GTX 480发布时的窘境吧,不过这一切随着GTX 680的到来而逆转了,满载功耗比AMD控制的还要好,士别三日当刮目相待。

    ◆ 超频:Kepler初露锋芒

      28nm制程的显卡一个显著的特点就是核心频率起步很高,AMD已经推出HD 7770以及HD 7870这两款预设频率就过1GHz的显卡,HD 7970也达到了925MHz,如今NVIDIA GTX 680不仅核心频率达到1006MHz,Boost加速频率也有1059MHz,比AMD的还要高。


    NVIDIA官方资料显示GTX 680也可以轻易达到1.2GHz以上

      GTX 680超频遇到的第一个问题是没有超频软件,最新的Afterburner 2.20 beta 14对Kepler支持不完全,识别出的规格也是706/1411/1502MHz,即便开启非官方超频模式之后频率上限也锁定在920MHz,也不能改电压。

      另一个软件Nividia Inspector 1.95.11也是如此,它倒是可以改电压和频率,但是参数识别也不正确,核心频率也显示只有706MHz。

      最后从影驰那里要到开发中的魔盘K,不仅可以正确识别所有参数,而且可以调节电压和频率,其他功能也在不断增加中,影驰总算也走在了超频软件的前列。


    影驰魔盘K已经支持GTX 680调节与超频

      除了性能监控以及超频之外,还有其他如影迷会、驱动下载、性能测试等功能,还有一个神秘功能未知,不过这里只看软件的超频功能。

      不过非常奇怪的是,即便其他参数都是正确的,但是包括魔盘K在内的GPU监控以及调整软件都绕不开“706MHz”这个死结,只有刚刚更新的GPU-Z 0.6.0例外。

      魔盘K的超频界面中,第一行是调节动态频率的,不过它跟核心频率的提升也是同步的,如果增加100MHz的动态频率范围,那么核心频率就会变为1106MHz,Boost频率则为1159MHz。

      魔盘K最大频率调节范围为200MHz,也就是说GTX 680的核心频率可以超到1206MHz,Boost频率1259MHz。

      第二行显示30FPS是新增的功能,它可以锁定Kepler的游戏帧速进而调节显卡的频率达到节能的目的,因为大部分情况下游戏根本不能100%发挥GTX 680的潜力。需要注意的是默认锁定在30fps,如果要超频的话需要拉到255fps最大值,不然性能会受影响。(跟影驰沟通过,后续版本这个功能应该不会再默认锁定30fps了)

      此外,魔盘K还支持核心电压调整,默认0.987V,最大1.2V,不过现在还不能调节显存电压。

      其它功能不再一一介绍,下面来看一下超频结果。


    首先增加144MHz,核心频率达到1150MHz,轻松通过(点击放大)

      先是很小心地尝试加了144MHz,核心频率提高到1150MHz,Boost频率已经达到1203MHz了,结果很轻松地过了3Dmark 11,得分P10589,提升了10.5%。


    直接拉到200MHz也没问题(点击放大)

      直接提升200MHz之后核心频率已经达到1206MHz,Boost频率1259MHz,通过测试也没问题,此时得分为P10891,相比原来提升了13.6%。

      目前为止1206MHz是最高了,因为魔盘K现在只能加这么多,但是GTX 680的超频潜力显然还没到顶,目前这个超频状态还是没有加压、没有改默认风扇转速的情况下实现的,一旦后续软件更新的话,那么GTX 680的超频能力才有机会进一步释放。

      超频到这里还只是开始,前面的超频只调节了核心频率,显存频率未动,那么核心和显存一起超频,最高能到多少呢?


    超频最终结果登场,显存达到1815MHz(点击放大)

      核心频率可以达到1206MHz,显存频率达到1815MHz(等效7260MHz),分数提高到P11182,比原始性能提高了16.6%。

      HD 7970的显存超频能力也很强,不过之前的几款显卡最高也只能在加压到1.7V电压后超到1770MHz左右,依然是GTX 680胜出。

      另外,由于GTX 680动态超频技术的存在,GPU-Z里显示的频率实际上要比真实频率要低,比如前面超频到1206MHz之后,在游戏测试中实际运行在1270MHz。


    实际运行频率其实要高于GPU-Z显示的(点击放大)

      上面是循环运行3DMark 11测试的细节截图,GPU-Z显示频率只有1206MHz,但是影驰魔盘K实时捕捉的频率显示为1270MHz,换句话说就是表面上只超到1206MHz,但是实际频率已经达到了1.27GHz。

      AMD HD 7970显卡给人印象最深的地方之一就是超频能力强劲,不过默电能上1.2GHz也的看运气,还得调高风扇转速忍受噪音,而GTX 680的超频表现很快就让HD 7970的超频能力黯淡了下去。

      即使因为超频软件的限制,GTX 680也能在默认0.987V电压下达到1.2-1.27GHz的频率,最主要的是风扇不需调速,依然只有轻微的运行声音。再考虑到公版显卡的PCB做工其实很烂,如果日后开放非公版,我们大可以期待GTX 680能创造新的超频记录,1.3GHz应该只是门槛,液冷才能达到的1.4-1.5G或许能在风冷条件下实现。

    GTX 680:全方位的进步,完美的性价比

      GTX 680在性能上扳回了一局,夺回了性能王者地位。3DMark 11的理论测试中表现比HD 7970更猛,P和X模式都有20%的以上提升。实际游戏中有三个项目输给HD 7970,其他项目都或多或少都赢了,平均下来就是比HD 7970领先10%的样子。

      当然,GTX 680也有比不过HD 7970的地方,GPU计算性能上输多赢少,特别是涉及双精度运算的地方差距还非常大,HD 7970的高速数据吞吐能力、超高带宽还是GTX 680比不上的。

      惊爆眼球的地方其实并非性能,而是GTX 680的功耗控制,轻负载测试中只比HD 7970高10-20W,如果剥去HD 7970的电源控制,那么GTX 680的实际功耗要比HD 7970还要低,个人觉得这里的翻盘才是GTX 680最值得夸奖的地方,几年来的功耗大户的帽子终于甩掉了。

      与之对应的是温度和静音,温度上比HD 7970的还是要高几度,但是静音水平上完胜,游戏和拷机时GTX 680都只有轻微的风扇声,而HD 7970则有明显的风扇声,二者一对比就会觉得HD 7970很吵了,因为HD 7970为了温度牺牲了静音,GTX 680则是为了静音牺牲了一点温度,两相比较还是觉得静音更重要。

      超频性能上GTX 680再次给人以惊喜,不加压的情况下都可以跑到1.2GHz,再算上GPU Boost的加速,实际运行频率达到了1.27GHz,日后放宽频率限制的话估计上1.3-1.4GHz是没问题的。

      最后的关键因素是价格,GTX 680的国外定价也是499美元(文章完成时一直都说是549美元),不过国内售价只有3999元,比AMD当初的4299-4699元厚道的多。在性能、功耗、超频等方面全面压制对手的情况下,GTX 680的定价还比HD 7970更低,估计AMD很快要大降价了。

      GeForce GTX 680相比前辈GTX 580是有着全面的进步的,即便与HD 7970相比,它在性能、功耗、超频以及静音上也是胜出的,再算上3999元的价格,整体表现堪称完美,只不过这个完美我更愿意送给GK104芯片,公版GTX 680显卡还有一点瑕疵让人耿耿于怀,作为旗舰显卡的GTX 680 PCB用料应该可以更好一些。

      鉴于GTX 680在性能、功耗控制、超频以及性价比上的突出表现,我们授予GTX 680显卡“超能网2012推荐奖”,NVIDIA这次的表现真的很给力。

    ×
    热门文章
    1华硕发布RT-BE88U Wi-Fi 7双频路由器:10网口配置,无线速率达7200Mbps
    2九州风神推出PN D/M系列电源:支持ATX 3.1规范,双金牌认证,399元起
    3小米SU7正式发布,售价21.59万元起
    4微星Z790 PROJECT ZERO上市:ATX背插主板,售价2599元
    5TRYX创氪星系品牌发布会:推出AMOLED屏水冷及海景房机箱
    6Thermaltake推出钢炼 S250 TG ARGB机箱:支持5槽厚显卡竖装及前置420冷排
    7乔思伯TF2-360SC一体式水冷散热器上架:冷头带IPS屏,无风扇版售价749元
    8先马趣造G65键盘体验:沉醉在磁轴带来的灵敏精准触感
    9一加 Ace 3V 手机体验:首发第三代骁龙7+,为中端机型带来代际升级
    已有 76 条评论,共 145 人参与。
    登录快速注册 后发表评论
    • 游客  2016-03-30 14:23

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(3)  |   反对(1)  |   举报  |   回复

      76#

    • 游客  2016-03-26 02:49

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(2)  |   反对(1)  |   举报  |   回复

      75#

    • 游客  2016-03-08 19:51

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(1)  |   反对(1)  |   举报  |   回复

      74#

    • 游客  2015-09-29 15:51

      该评论年代久远,荒废失修,暂不可见。

      已有3次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      73#

    • 游客  2015-06-13 11:05

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      72#

    • 我匿名了  2012-05-19 19:10

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      71#

    • 游客  2012-04-10 14:53

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(2)  |   反对(1)  |   举报  |   回复

      70#

    • 超能网友小学生 2012-03-30 13:07    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(2)  |   反对(1)  |   举报  |   回复

      69#

    • 游客  2012-03-29 17:31

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      68#

    • 游客  2012-03-27 22:36

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(2)  |   反对(0)  |   举报  |   回复

      67#

    • 超能网友管理员 2012-03-27 10:08    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      66#

    • 游客  2012-03-27 01:02

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(16)  |   反对(4)  |   举报  |   回复

      65#

    • 游客  2012-03-25 17:19

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      64#

    • 游客  2012-03-25 14:02

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      63#

    • 游客  2012-03-25 11:13

      该评论年代久远,荒废失修,暂不可见。

      支持(3)  |   反对(1)  |   举报  |   回复

      62#

    • 游客  2012-03-24 23:57

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      61#

    • 超能网友教授 2012-03-24 20:49    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      60#

    • 游客  2012-03-24 19:14

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(2)  |   反对(0)  |   举报  |   回复

      59#

    • 游客  2012-03-24 17:10

      该评论年代久远,荒废失修,暂不可见。

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      58#

    • 游客  2012-03-24 15:58

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      57#

    • 超能网友终极杀人王 2012-03-24 13:11    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      56#

    • 超能网友终极杀人王 2012-03-24 12:57    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      55#

    • 游客  2012-03-24 07:58

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      54#

    • 超能网友博士 2012-03-23 23:00    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      53#

    • 超能网友博士 2012-03-23 21:18    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      52#

    • 游客  2012-03-23 20:00

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      51#

    • 游客  2012-03-23 17:12

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      50#

    • 游客  2012-03-23 17:02

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      49#

    • 游客  2012-03-23 17:02

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      48#

    • 游客  2012-03-23 15:24

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      47#

    加载更多评论

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明