GTX680能否斩杀对手 Kepler上演完美复仇

拼命加载中 ...

　　GTX680是NVIDIA全新GPU架构Kepler的桌面顶级图形核心，这颗芯片凝聚了NVIDIA多年来的设计研发实力，同时GTX680也对刚换用新图形架构的AMD Radeon南岛家族显卡做出正面回应。

　　作为全新架构的首位承载者，我们看到GTX680编号可能会误认为这是新架构的顶级产品，其实顶级核心代号GK110尚未诞生，而GTX680采用GK104芯片是专为图形游戏应用设计的性能型产品，它在性能、功耗、发热等多个方面追求平衡，最终将GPU核心与显卡的可制造性提升到新高度。

　　流言蜚语应该终结了，与对手真刀真枪决战的时候到了。

　　自从发布GCN架构的南岛家族显卡之后，AMD一直沐浴在胜利的光环之中，HD 7970显卡不论在3D游戏还是NVIDIA引以为傲的通用计算上都是大跃进一般的提升，而28nm工艺带来的功耗控制以及超频能力也着实让人吃惊，首发优势让AMD占尽上风。

　　整个DX11时代，AMD往往占有先发优势，但后发的NVIDIA也能成功翻盘，比如GTX 480 vs HD 5870、GTX 580 vs HD 6970。如今HD 7970当道，NVIDIA的Kepler时隔三个月之后终于追上来了（HD 7970于去年12月22日发布，正好是三个月间隔），期待已久的大战终于开始了。

GTX 680：决一死战吧，我的宿敌，Radeon君！

　　战鼓已经响起，来吧，HD 7970，你已经享受了三个月的美好时光，在你的辉映下我的兄弟GTX 580黯淡无光，功耗更被揭了老底，但是你真正的对手是我，现在的我已经今非昔比，战争才刚刚开始，我要夺回属于我的王者之位！

　　目前双方选手已经就位，一方是现在洋洋得意的胜利者，一方是卧薪尝胆归来的复仇者和它受气的小弟，下面来看一下这三位选手的具体情况。

　　需要注意的是，GTX 680是否支持DX11.1存疑，虽然0.6.0版GPU-Z显示它支持DX11.1（它同时也把GTX 680识别为PCI-E 2.0 x16带宽），但是NVIDIA的驱动控制面板的信息中依然显示DX11，而且官方文档中似乎也没提及DX11.1支持，因此我们更倾向于GTX 680不支持DX11.1。(看来跟DX10.1一样要跟AMD对着干到底）。

　　与GTX 580相比，GTX 680的CUDA核心数高出2倍，总计有1536个，纹理单元也翻倍达到128个，ROP单元则减少到32个，低于GTX 580的48个。规格同样有所精简的还有显存位宽，从384bit降到256bit，但是GTX 680的显存频率达到1502MHz，一举超过AMD的1375MHz，显存总带宽也有192GB/s，比GTX 580还要高一点，不过跟384bit的HD 7970还有一定距离。

　　GTX 680最明显的改进是在功耗和核心面积上，后者只有区区294mm²，大大低于GTX 580的520mm²，也低于HD 7970的365mm²，甚至比当前的GF114核心的360mm²还要低很多。TDP更是只有195W，秒杀HD 7970的210W、GTX 580的244W，绝对是NVIDIA自GT200架构以来面积最小、功耗最低的顶级卡核心。

　　GTX 680一改我们平时对NVIDIA显卡的认识，这还是个高性能、高发热的N卡吗？究竟它背后发生了怎样的变化，CUDA核心连升三级、功耗反而更低，现在就来揭开Kepler的架构之谜吧。

◆ Kepler架构解析：3倍核心是怎样练成的

　　早前在分析Kepler的架构的文章中，我们就提出了GK104架构像GF100还是像GF114的问题，网上甚至有人根据GK104那1536个CUDA核心的规格PS出了GK104的架构，当然最终的结果是GK104更像GF114那样，GPC和SM单元数量减少，但是每组SM单元容纳的CUDA核心更多。

GF110架构图

　　GF110有为4组GPC，每组下辖4组SM单元，每组SM单元又有32个CUDA核心，总计有512个CUDA核心，64个纹理单元，48个ROP单元，16个曲面细分单元，搭配6组64bit显存控制器，总计384bit位宽，1536MB显存。

GF114架构

　　GF114架构中只有2组GPC单元，SM单元数量也从16组减少到8组，但是每组SM单元的CUDA核心数提高到48个，内存控制器减少到4组，总位宽256bit，曲面细分单元也减少到8组，但是纹理单元依然维持在64个，ROP单元也有32个。

　　通过这些优化，GF114架构的核心面积大幅减少，而性能也没有因为规格大减而损失多少。

GK104的核心透视图

　　NVIDIA给出的GK104核心透视图上可以清晰地看到它有8组SM单元，架构上跟GF114更为相似。

GK104架构图

　　从这张图上可以看到GK104有四组GPC单元，每组又由2组SM单元组成---准确来说是SMX单元，NVIDIA对SM的称呼有所变化。

　　现在来对比一下GF110、GF114以及GK104架构中的SM/SMX单元变化。

GF110 SM单元（左）、GF114 SM单元（中）以及GK104 SMX单元（右）对比（点击放大）

　　GF110的SM单元有32个CUDA内核，四个SFU单元，16个LD/ST存储单元，64KB L1本地缓存，每组SM单元有4组纹理单元，总计64个纹理单元。另外每组SM还有一个多边形引擎负责曲面细分计算。

　　GF114的GPC和SM单元总数砍掉一半，SM还剩8组，但是每组容纳的CUDA内核数增加到48个，SFU单元增加到8个，LD/ST也增加到32个，相应地Dispatch单元也增加了一组，L1缓存依然为64KB，不过纹理单元增加到8个，总数依然维持在64个，不过此时的多边形引擎也没有变化。

　　GK104的SMX单元中，NVIDIA大手笔集成了192个CUDA核心，纹理单元也增加到16组，前端渲染单元也增加到四组，同时SFU以及LD/ST单元也是水涨船高，增加到32组，纹理单元再次翻倍，8组SMX单元总计有1536个流处理器、128个纹理单元以及32个ROP单元。

GK104与GF110规格对比

每组SM/SMX单元性能对比

　　更主要的是内在的变化，从Kepler开始，NVIDIA以往坚持的Core：Shader=1：2的分频模式已经没有了，以前采用这种方式是因为核心频率不能大幅提高，为了提高性能就必须让CUDA的核心频率增加一倍，但是这也意味着更高的能耗。

　　GTX 680中NVIDIA将SMX单元中的CUDA核心数提高至原来的3倍，而且核心频率也达到1GHz以上，不再需要Shader异步了，二者将同频运行，有助于降低显卡功耗，因此GTX 680在CUDA数量暴增的同时功耗更低，而每瓦性能比更是提高了一倍。

　　还有一个变化就是Polygon多边形引擎升级到2.0，虽然物理单元结构没有变化，但是Kepler的PolyMorph Engines 2.0的每周期性能是GTX 580的两倍多，再加上1006MHz的频率也要比GTX 580高出30%，因此整体性能反而会更强。即便与对手HD 7970相比，NVIDIA宣称GTX 680的曲面细分性能要比后者快4倍。

◆ GPU Boost：GPU加速我也行

　　Intel和AMD各自为旗下的CPU开发了动态超频技术，简单来说就是在CPU功耗没有达到TDP设定值之前提高CPU频率，视多个内核的负载程度不等也会有不同的频率提升。比如测试用的Core i7-2600K，默认频率为3.4GHz，四核运行最高可以加速到3.5GHz，双核负载下可以加速到3.6GHz，单核应用时最高可以加速到3.8GHz。

Kepler架构的显卡没有Shader频率，但是多了Boost频率

　　现在Kepler显卡也有了类似的动态超频技术，它的技术原理跟CPU相似，在TDP范围内提供更高频率。如上图所示，GTX 680的核心默认频率为1006MHz，Boost频率为1059MHz，高了53MHz。

Kepler显卡的动态加速技术原理

　　一般来说，除了Furmark、OCCT这样的拷机测试中很少有游戏或者测试能使GPU达到全负荷运行的，即便GPU-Z显示百分百的GPU占用也不意味着GPU到顶了。在TDP功耗未到上限时，显卡的BIOS会自动提升核心频率，负载越低可提升的空间就越大，一旦功耗达到TDP值，那么频率也会自动降至标准范围，然后再进入下一个循环。

3DMark 11负载中GPU加速就会不断调整频率

　　这张图就是在3DMark 11的测试中不同的截图拼接起来的，默认的频率为1006MHz，但是运行过程中频率会上升到1045、1058MHz，最高达到1084MHz，比显示的Boost频率还要高。

　　此外，GPU Boost在显卡超频的时候依然不会失效，因为NVIDIA设定的默认频率与Boost频率是有一个固定比率的，具体数值大约是1.058，也就是说你超频到1.2GHz，还是会存在一个1.2GHz*1.058=1.27GHz的Boost频率。

◆ Bindless Texture：纹理操作不再受限

　　Fermi及当前的DX11显卡在读取纹理数据时需要先分配一个“槽”（slot），它位于有着固定大小的binding Table表中。每个shader每周期可以读取的纹理数据基本上取决于slot的数量多少，在DX11 API规范中，每个shader最多只可以同时操作128个纹理数据。

目前的显卡的纹理操作有总数限制

　　Kepler显卡支持Bindless Textures（无束纹理）技术，此时进行纹理数据操作就不需要上面那个多余的步骤了，shader可以直接从显存中读取纹理数据，而且没有数量限制，一个场景内甚至可以有一百万个独一无二的纹理存在。

　　另外，使用Bindless Textures除了可以大幅提高纹理的数量，还有一个好处就是可以减少CPU占用率。

　　目前Bindless Textures还只应用OpenGL规范中，未来可以通过NVAPI间接实现DX API支持Bindless Textures，后续的DX版本也可能支持直接这一技术。

◆ 自适应性同步：游戏更流畅

　　游戏里的同步技术，特别是垂直同步技术让人又爱又恨，开启它可以防止画面撕裂，但是很多场合它又会限制帧数导致游戏有卡顿的感觉。

开启垂直同步，部分场景帧数觉剧降而造成卡顿的感觉

关闭垂直同步，部分场景又可能存在画面撕裂的可能

　　为了解决这种"前怕狼后怕虎"的矛盾，NVIDIA提出了Adaptive VSync（自适应同步）技术，它可以让驱动程序自主决定垂直同步开关与否，避免出现上面的尴尬。

NVIDAI的Adaptive VSync可以减缓垂直同步开关带来的影响

　　当游戏帧数低于60fps时，Adaptive VSync会自动关闭垂直同步以防止帧数卡顿，而当游戏帧数恢复到60fps左右时，垂直同步会再次打开以降低可能的画面撕裂。

新的300系列驱动已经集成了Adaptive VSync选项

　　好消息是NVIDIA的新一代300系列驱动中已经集成了Adaptive VSync选项，而且并非Kepler显卡专属，GTX 400、GTX 500显卡也会提供支持。

　　驱动提供了两个级别的选项，Adaptive 以及Adaptive（half refresh rate，半刷新率），后者主要用于显卡性能不强、帧数处于20-50fps之间的情况，此时垂直同步的帧数会锁定在30fps而非通常的60fps。

◆ FXAA与TXAA：画质更高，速度更快

　　目前显卡的抗锯齿（AA）大都集中在后期处理AA而非传统的硬件AA，后者的典型代表是MSAA（多重采样抗锯齿），不过它的资源消耗很高，性能损失比较大。后期处理AA技术主要有NVIDIA开发的FXAA、AMD发扬光大的MLAA以及SQAA等。

　　伴随Kepler显卡的推出，NVIDIA除了继续改善FXAA性能之外，还提出了一种新的名为TXAA的新技术。

FXAA已经集成到驱动面板中

　　此番展示FXAA的Demo是EPIC在GDC 2012展会上公布的Samaritan demo，这款demo实际上是去年就发布了，不过现在展示的demo增加了FXAA支持。

　　
FXAA与4xMSAA画质对比（点击放大）

No AA与FXAA画质对比（点击放大）

　　以上是Samaritan demo中的FXAA与No AA、4xMSAA的画质对比，结合我们之前多次测过的FXAA性能来看，它确实很有发展潜力，画质与4x MSAA相当，但是速度要快得多。

300系列驱动开始也集成了FXAA选项

　　目前的300系列驱动也很贴心地集成了FXAA选项，终于可以不用在四处找游戏的FXAA补丁了，不过需要注意的是已经支持FXAA的游戏如《蝙蝠侠》、《战地3》、《上古卷轴5》这个选项是不能开启的，《Far Cry 2》这样原本不支持FXAA的倒是可以开启。

　　另外，FXAA也不是一成不变的，从《柯南时代》最早应用以来，已经发展出偏重画质的FXAA 1、FXAA 2以及侧重速度的FXAA 3等多个级别，目前的游戏支持的FXAA主要是FXAA 1或者速度更快的FXAA 3，而驱动中提供的FXAA介于FXAA 1和FXAA 3之间，画质比FXAA 3更高，不过速度比FXAA 3要低一些。

TXAA投石问路

　　TXAA是伴随Kepler显卡问世的新型AA，它是工业电影使用的AA技术，可以充分利用Kepler的FP16纹理性能。TXAA混合了硬件MSAA、CG电影AA的优点，而2x TXAA会有更高的画质。

　　构成TXAA的基础是一种高画质过滤器（resolve filter），主要用在后期处理中进行HDR纠正。

　　以下三张是8x MSAA、No AA以及TXAA的画质对比图，点击放大。

　　TXAA有两种主要类型，TXAA 1和TXAA 2，前者的画质相当于8x MSAA而速度可与2x MSAA相媲美，而TXAA 2的画质要高于8x MSAA，但是速度相当于4x MSAA。

　　现在的游戏还不支持TXAA，不过今年晚些时候发布的游戏和引擎如MechWarrior Online、Secret World、 Eve Online、Borderlands 2,、Unreal 4 Engine、 BitSquid、 Slant Six Games以及 Crytek将会支持TXAA，未来更希望TXAA也能像FXAA那样集成到驱动面板中。

◆ 编码专用单元，全新3+1屏幕组合

　　与HD 7970一样，Kepler显卡也支持最新的多种显示技术规范，比如4K分辨率、3GHz HDMI,multi-stream audio多音频流，并改进了视频转码性能。

NVENC编码加速单元

　　视频编码加速是最具实用性的GPU加速技术之一，之前NVIDIA的显卡使用的大都是基于CUDA加速的方案，虽然CUDA转码速度快，但是存在大材小用、浪费功耗的问题。在Kepler身上，NVIDIA又增加了全新的专用编码单元以大幅提升编码速度。

　　Kepler设计了专门的转码单元，整体概念类似Intel SNB架构中的Quick sync转码单元，它支持H.264规范，编码速度比使用CUDA加速要快3倍。此外，软件可以自己选择使用CUDA加速还是使用这个专用转码单元，或者同时使用这两种加速方法。

NVENC主要特性

1：以8x或更高的实时比例编码1080p视频，比如16分钟时长、30fps的1080p视频重编码时间只需要2分钟时间。

2.支持H.264 Base, Main, and High Profile Level 4.1规范。

3.支持蓝光3D使用的MVC立体视频。

4.支持4K分辨率。

　　　目前NVIDIA主要通过授权API、提供SDK的方式推广NVENC编码，现在支持NVENC编码的主要是新版本MediaEspresso软件，后面我们也有专门的转码测试。

单卡支持3D Vision Surround模式

　　目前NVIDIA的显卡要想实现3D Vision Surround至少需要2张卡SLI，相比AMD的宽域多屏技术不够灵活。随着Kepler的发布，NVIDAI也终于实现了单卡实现3D Vision Surround了。

3+1多屏组合

　　另一个重要的改进就是多屏输出，GTX 680的接口中有2个双链DVI、1个HDMI以及1个DP，其中前三个接口可以组建三屏模式，余下的DP接口还可以再接一个显示器组成3+1多屏模式，下面的三个显示器可以玩游戏，而上面的显示器可以用来聊天、收发邮件之类的工作。

多屏模式下可以将任务栏放置在中间的显示器底部

边框修正以及边框Peak

　　多屏游戏有个恼人的问题就是显示器边框会遮挡游戏内容，Kepler支持边框修正，可以将遮挡的部分显示出来。还有就是边框Peak，使用快捷键调出被隐藏的界面。

我们也初步体验了一下GTX 680的单卡三屏

　　我们也尝试了GTX 680的三屏模式，单卡确实可以组建5760超大分辨率屏幕，不过这次时间紧迫，显卡周转的频繁，没能深入体验，以后还会有更详细的体验文章。

◆ 公版GTX 680外观赏

NVIDIA GTX 680显卡

　　在其他高端卡忙着增重增长的同时，GTX 680给人的感觉是变秀气了，PCB长度减少到25cm，820g的重量也要低于GTX 580的890g，更低于HD 7970的1010g。

这个角度也能看出GTX 680确实变短了

边缘位置印的logo也比前代更明显

独特的6pin排列方式

　　GTX 680的供电接口不仅从GTX 580的8pin+6pin“简化”到双6pin，而且这两个6pin接口的排列方式也不再是平行的，而是上下叠加，方式很新颖。有人觉得这种排列方式更节省空间，不过我觉得跟传统的双6pin排列是一样的。

　　至于有人担心因为两个接口相对排列而带来接口不易插拔的问题，使用中并没发现这个困扰，这两个接口错开了一定位置，只要先拔上面的接口就不会有问题。

视频输出接口

　　接口方面，之前NVIDIA公版卡的标准搭配是双链DVI+mini HDMI，GTX 680除了双链DVI之外，还提供了HDMI以及DP，虽然接口数量上还比不过HD 7970，好歹也进步了许多。

　　另外，GTX 680单卡支持三屏输出，使用DP接口的话还可以组建4+1方式的多屏。

◆ 公版GTX 680散热器拆解

　　在GTX 580甚至之前的GTX 480，NVIDIA显卡的功耗和发热比较高，公版散热器的表现只能用高温高噪音来形容，以致于NVIDIA动用了硬件监控电路以强制降低显卡功耗。

　　GTX 680的TDP只有195W，核心也只有294mm2，这两项指标甚至比HD 7970还要优秀，散热器终于有翻身的机会了。

官方的资料称GTX 680的散热器为静音设计

散热器主体

　　散热器的主要架构跟之前的GTX 580相比其实没有太大变化，依然是涡轮风扇、铝质鳍片、导风罩以及辅助钢板。

拆掉导风罩后的样子

散热器的三大组件

铝质鳍片+均热板，唯一的变化是底部也没有凸起了

钢板覆盖了大部分PCB面积，可以起到辅助散热的作用

涡轮风扇，上面没找到标签，，只知道是酷冷代工，看不到具体的信息，实测发现声音并不吵

　　虽然NVIDIA宣称新散热器的效果如何好，不过对比了之前GTX 580的公版散热器，二者的结构大同小异，散热器的静音主要应该是受惠于GTX 680的功耗大幅降低。

◆ GTX 680 PCB与GTX 580对比

NVIDIA GTX 680与GTX 580 正面PCB对比（点击放大）

　　与前辈GTX 580的PCB相比，GTX 680的长度只有25cm（10英寸），比GTX 580以及HD 7970的26.7cm（10.5英寸），这也是近几年来旗舰级显卡首次缩短PCB。

　　GTX 680的GK104核心面积显著缩小，已经用不着GF100那样的金属盖来加强散热了，二者差异明显。另外，GTX 680是2GB显存，核心周围只布置了8颗显存，而GTX 580是1536MB，但是显存颗粒有12颗，排列的比GTX 680要紧密。

　　右侧的供电电路部分，GTX 680由GTX 580的6+2相减少到4+2相，核心部分的四相供电元件也倾斜90度变成横向排列了。

NVIDIA GTX 680与GTX 580 背部PCB对比（点击放大）

　　这是二者背部PCB的对比，GTX 680的核心处滤波电容要少几颗，整体的感觉就是GTX 680更“简洁、光滑”一些，不像顶级卡的风格啊。

　　核心编号为GK104-400，A2步进，台积电TSMC 28nm工艺制造，长宽分别为18.7mm、16.8mm，表面积为314mm2，实际核心面积为294mm2，看来之前那位用PS计算出GTX 680面积为320mm2的同学算的还蛮准的。

显存颗粒来自Hynix

　　显存颗粒也是来自Hynix，编号H5GQ2H24MFR，单颗32bit位宽，2Gb容量，跟HD 7970使用的是一样的，R0C后缀表明其频率为6GHz，实际运行频率为1502MHz，远远高于Fermi时代NVIDIA显卡的显存运行频率，要知道GTX 580才是1002MHz（等效4008MHz）。

4+2相供电

　　GTX 680的功耗以及核心面积大降，因此供电电路要求也没这么高了。公版标配只有4+2相，4相为GPU主供电，2相为显存供电。从图中可以看到有1相是虚焊的，之前泄露的PCB上显示是5+2相供电的。

供电PWM芯片

　　供电PWM芯片为RT8802A，台湾立琦公司出品，支持2/3/4/5相供电自动管理。

　　核心的4相使用了立隆固态电容、R22贴片电感以及1上2下MOSFET，上桥为4939N，下桥为两颗4935N，安森美出品，Super SO-8封装。

显存2相供电

　　显存的2相独立供电使用的是ECR12固态电容、eR33电感以及1上1下MOSFET，上桥为MDU1514，下桥为MDU1516，韩国Magna公司出品，PowerDFN56封装。

　　总的来看，GTX 680作为一款售价4000元的显卡，PCB做工与用料真的一般般，很多几百元显卡的用料都比它还好，NVIDIA真是省到家了。当然，我们也不是唯用料论，供电的简化说明显卡的要求更低了，这对消费者来说是好事。对用料要求较高的玩家只能等待厂商的各种超公版了。

◆ 影驰GTX 680赏析

影驰GTX 680表面没有花哨的贴纸，只在左上角有个影驰的logo

接口也是公版的四个数字输出接口

摄影师henery出境了

PCB背面

显卡包装

◆ 索泰GTX 680赏析

索泰GTX 680也是公版设计，换了索泰风格的黄色贴纸

显卡包装不同于索泰以往的风格，有点小清新

◆ 昂达GTX 680典范版赏析

昂达GTX 680显卡

输出接口

散热器

PCB供电设计

GK104-400核心

Hynix的GDDR5颗粒

显卡包装

◆ 映众GTX 680赏析

映众GTX 680游戏高手显卡

映众是唯一一个换了PCB颜色的，虽然也是公版设计，但是PCB是映众自己生产的

也是RT8802A PWM芯片，表明它也是公版设计

显卡包装

◆ 耕昇GTX 680关羽版赏析

耕昇GTX 680关羽版

显卡包装

显卡包装及附件

◆ 北影GTX 680赏析

北影也在第一时间推出了自家的GTX 680显卡

◆ 华硕GTX 680赏析

◆ 微星GTX 680图赏

◆ 测试平台图赏

　　测试平台为Core i7-2600K，1.4V电压下超频到4.8GHz，内存为四条芝奇DDR3 1600，总容量16GB，散热器为Super Mega，搭配12cm静音风扇。

测试平台（点击放大）

另一角度

　　为了统一日后的温度测试，机箱将固定为振华SF-1000，开启2个前置风扇，后置风扇以及顶置的20cm风扇。

振华SF-600P14PE电源

　　随着NVIDIA显卡功耗的大幅下降，测试根本就不需要再搭配800W或者1000W的电源了，600W金牌电源即可，不过这款电源是非模组化设计，理线麻烦了点。

测试对比了GTX 580、GTX 680以及HD 7970三款显卡

从这个角度可以看到GTX 680是最小巧的

实际上GTX 580和HD 7970的PCB是一样长的，不过HD 7970的导风罩更长，显得更大

◆ 测试平台详细说明

　　测试平台配置为Core i7-2600K，并在1.4V电压下稳定超频至4.8GHz（48x100MHz），搭配四条芝奇DDR3 1600 4GB内存，总计16GB，时序为9-9-9-24，对比测试了HD 7970以及GTX 580两款显卡。

　　软件平台为Win7 X64 SP1，HD 7970使用12.2 WHQL驱动，GTX 580在功耗以及温度测试时使用的是266.58驱动以破解功耗保护，性能测试时使用最新的296.10 WHQL驱动。GTX 680使用的是300.99 beta驱动。

　　测试的主要项目依然分为游戏性能以及计算性能，并做了一些调整，增加了DX11游戏的比重，并针对曲面细分、FXAA做了针对性测试。计算性能测试增加了MediaEspresso转码对比，转码功能比其他的OpenCL测试要实用的多。

◆ 曲面细分性能：GTX 680以少胜多

　　进入DX11时代之后，AMD与NVIDIA就曲面细分性能交火不止一次两次了，每次发布新架构显卡都有针对曲面细分所做的改进，AMD称HD 7970上的曲面细分单元已是第九代，数据吞吐能力比HD 6900系列提高4倍多。对NVIDIA来说，Fermi架构每组SM单元有一个多边形单元，总计拥有16个多边形单元，而Kepler有8组SM单元，多边形单元数量减少到8个，但是性能反而更强。

　　曲面细分性能测试选择了微软DX11 SDK自带的Sub11测试以及Heaven 3.0，前者功能专一，所以只调整分辨率至2560x1600，后者还要涉及其他DX11特性，所以分辨率为1920x1080，High画质，依次开启四个曲面细分级别。

　　纯理论的曲面细分性能中，GTX 680有392.7帧，比GTX 580的227.2帧高了73%，进步明显，不过比HD 7970的475.2帧要低17%。

　　曲面细分性能并不能单独独立于DX11特性之外，如果放在实际游戏中，GTX 580从禁用曲面细分到最高级的曲面细分性能损失了40%，HD 7970损失了45%，而GTX 680损失了39%，稍微领先了一点。

　　这意味着虽然GTX 680的多边形单元数量减少了一半，但是实际性能比前代还要大幅胜出，理论性能比HD 7970要低一些，一旦综合到DX11特性中差距并不明显。

◆ FXAA性能：比GTX 580快一倍

　　FXAA的讨论以及测试我们做过了很多，相比大量耗费资源的MSAA，FXAA性能损失更少，速度更快，而画质不相上下。作为FXAA的开发者，NVIDIA对FXAA的支持也不遗余力，300.99驱动面板中已经集成了FXAA开关，可以强制在游戏中使用FXAA。

　　FXAA的测试选择了NVIDIA官网的一个类似DX11 SDK的小工具，另外还有游戏《Batman：Arkham City》，后者支持三种级别的FXAA设置，游戏设置在1920x1080分辨率、DX11模式、Very High画质下。

　　这个理论性的FXAA测试中GTX 680相比GTX 580优势明显，性能提升了98%,接近一倍，当然比HD 7970要低7帧，二者差距甚微。

　　实际游戏中效果更不明显了，在《Batman》游戏中开启FXAA与否对帧数影响很小，GTX 580只损失了4%的性能，HD 7970的性能损失为7.4%，GTX 680损失了3.7%，看来作为技术的提出者NVIDIA显然还是有一点先天优势的。

◆ 计算性能：GTX 680喜中带忧

　　自从GCN架构也将计算性能作为重点之后，AMD与NVIDIA又多了一个战场，谁又是新的计算性能王者呢？

　　MediaEspresso 6.5测试选择的是一段1080p分辨率的VC-1片段转成1280x720p的H.264影片，各自开启相应的硬件加速技术。

　　首先是超频到4.8GHz的四核八线程CPU，用时52秒，GTX 580用时40秒，HD 7970用时45秒，到了GTX 680身上用时缩短至32秒，GPU加速性能上GTX 680再次领先。

　　Compute Mark测试中GTX 680大幅领先GTX 580，但是对阵HD 7970已经有了败绩，差了300多分。这是测试误差还是软件支持不够好？

　　在GPC Benchmark测试中，GTX 680的单精度性能相比GTX 580无悬念地再次胜出，但是与HD 7970相比，单精度运算低了28%，但是双精度以及密码运算上差距悬殊，只有HD 7970的七分之一到三分之一。

　　在LuxMark 2.0的测试中，特意选择最复杂的Room室内场景，GTX 680只有278分，不仅大大低于HD 7970的1028分，也没有超过GTX 580的408分。

　　GPU计算中还有Sandra 2012的相关测试，结果也类似，GTX 680的单精度性能比GTX 580要强，但是双精度性能上不仅大大低于HD 7970，甚至比GTX 580还要低。

　　现在AMD和NVIDIA的位置似乎颠倒了，AMD的显卡在计算性能上发力，而GTX 680反倒退步了。当然，这只是策略的调整，GTX 680只是一款显卡，上一代的Fermi为了计算性能所做的改进比如多级L1、L2缓存都会占据更多的核心面积，但是对游戏来说意义并不大。GTX 680的游戏性能确实更强了，而计算性能并非普通消费者关注的，另外更具实用性的编码加速性能上GTX 680并没有退步。

　　高性能HPC已经是NVIDIA的一大重点，如果是针对计算市场的Tesla分支的GTX 680肯定还会加强，只是这个就不在我们的讨论之内了。

◆GTX 680 vs GTX 580：游戏性能完胜

　　相对GTX 580来说，GTX 680在游戏性能上全面领先，特别是最新的DX11项目中大幅领先，3DMark 11 P和X模式下高出50%还多，其他DX11游戏中如《战地3》、《蝙蝠侠》以及《Crysis 2》中普遍也有20-40%的领先。

　　至于计算性能，MediaEspresso转码测试中比GTX 580更快，Compute Mark中也高了54%，不过双精度运算上比GTX 580还要低。

◆ GTX 680 vs HD 7970：游戏性能小胜，计算失利

　　真正的对决来了。

　　与AMD阵营的拳头显卡HD 7970相比，GTX 680有好有坏。好的方面是，游戏性能要高一点，而3DMark 11这样的测试中甚至会高20%以上。不过在《Metro 2033》、《Crysis 2》以及《Alien vs Predator》游戏中败给了HD 7970，差距在8-15%左右。

　　计算性能上GTX 680没能超越HD 7970，虽然MediaEspresso以及DirectCompute上领先了，但是其他测试中还是大比分落后于HD 7970，毕竟GTX 680不像Fermi那样身兼多职。

　　综合下来，GTX 680的游戏性能比HD 7970还是要领先9%左右，NVIDIA再次夺回性能王者，虽然领先优势相比GTX 580对阵HD 6970的时代在缩小。（不知道AMD会不会后悔没把HD 7970的频率定在1GHz以上）。

◆ 温度与噪音：公版卡不再是吵闹的代名词

　　温度测试封箱进行，机箱为振华SF-1000，开启两个前置12cm风扇、后置12cm风扇以及顶置20cm风扇。这几天气温回升，室温在23-24°C。

　　测试状态为待机、3DMark 11图形测试4循环以及1920x1080分辨率Furmark拷机，同时拷机情况下额外增加了HD 7970的电源控制选项，否则驱动会在测试中自动降频。

　　注意：功耗和温度测试中GTX 580使用的266.58驱动以破解功耗保护，性能测试部分使用的是最新的296.10驱动。

　　待机时GTX 680只有37°C，比HD 7970要低2度，比前辈GTX 580低了5度之多，待机状态下三款显卡都很安静，没有声音。

　　3Dmark 11负载下，HD 7970只有73°C，GTX 680有80°C，GTX 580已经升到84°C，同时也声音最吵的，HD 7970也有明显的风扇声，GTX 680转速在2300RPM左右，不过只有轻微的风扇声。

　　Furmark拷机下，GTX 580不用说又是温度最高的，转速达到3200转以上，噪音非常明显。HD 7970的拷机温度为80°C，放开电源限制后升到83°C，同时也有明显的风扇运转声。此时GTX 680的温度达到了85°C，比HD 7970要高一点，不过噪音要比HD 7970低，依然只有轻微的风扇声。

　　总体来看，除了待机温度之外，公版GTX 680的温度控制比GTX 580有了长足进步，要比HD 7970要差一点，不过噪音控制的很好，甚至可以是几代旗舰显卡中表现最好的，拷机时也只有轻微的风扇声。

◆ 功耗：GTX 680翻身，地位逆转

　　NVIDIA公布的GTX 680 TDP只有195W，而且GTX 680一改以往高端显卡6pin+8pin的供电接口的传统只使用两个6pin即可（不过供电接口规格高并不意味着功耗就一定高），那么曾经高功耗的N卡真的要变天了吗？

　　待机功耗上它与HD 7970相差不大，基本是同一量级，都大大低于GTX 580的126W。

　　3DMark 11中GTX 580继续大幅“领先”，HD 7970的整机功耗为249W，GTX 680约为262W，高了13W左右。

　　Furmark拷机中GTX 680的331W也要比HD 7970的308W高23W，不过一旦HD 7970剥去电源控制的外衣，其功耗也会大幅增加到361W，这时GTX 680会反败为胜，功耗上要低于HD 7970。

　　功耗的改善应该是GTX 680最明显的变化，给人觉得也是最重要的变化。以往测试A卡和N卡的时候，总结时大都是这样，（同级别显卡）N卡性能强，但是发热大、功耗高，A卡性能差一点，但是发热小、功耗低，综合表现好。

　　巨核心战略使得NV在GT200以及Fermi两代显卡上付出了相当大的代价，想想GTX 480发布时的窘境吧，不过这一切随着GTX 680的到来而逆转了，满载功耗比AMD控制的还要好，士别三日当刮目相待。

◆ 超频：Kepler初露锋芒

　　28nm制程的显卡一个显著的特点就是核心频率起步很高，AMD已经推出HD 7770以及HD 7870这两款预设频率就过1GHz的显卡，HD 7970也达到了925MHz，如今NVIDIA GTX 680不仅核心频率达到1006MHz，Boost加速频率也有1059MHz，比AMD的还要高。

NVIDIA官方资料显示GTX 680也可以轻易达到1.2GHz以上

　　GTX 680超频遇到的第一个问题是没有超频软件，最新的Afterburner 2.20 beta 14对Kepler支持不完全，识别出的规格也是706/1411/1502MHz，即便开启非官方超频模式之后频率上限也锁定在920MHz，也不能改电压。

　　另一个软件Nividia Inspector 1.95.11也是如此，它倒是可以改电压和频率，但是参数识别也不正确，核心频率也显示只有706MHz。

　　最后从影驰那里要到开发中的魔盘K，不仅可以正确识别所有参数，而且可以调节电压和频率，其他功能也在不断增加中，影驰总算也走在了超频软件的前列。

影驰魔盘K已经支持GTX 680调节与超频

　　除了性能监控以及超频之外，还有其他如影迷会、驱动下载、性能测试等功能，还有一个神秘功能未知，不过这里只看软件的超频功能。

　　不过非常奇怪的是，即便其他参数都是正确的，但是包括魔盘K在内的GPU监控以及调整软件都绕不开“706MHz”这个死结，只有刚刚更新的GPU-Z 0.6.0例外。

　　魔盘K的超频界面中，第一行是调节动态频率的，不过它跟核心频率的提升也是同步的，如果增加100MHz的动态频率范围，那么核心频率就会变为1106MHz，Boost频率则为1159MHz。

　　魔盘K最大频率调节范围为200MHz，也就是说GTX 680的核心频率可以超到1206MHz，Boost频率1259MHz。

　　第二行显示30FPS是新增的功能，它可以锁定Kepler的游戏帧速进而调节显卡的频率达到节能的目的，因为大部分情况下游戏根本不能100%发挥GTX 680的潜力。需要注意的是默认锁定在30fps，如果要超频的话需要拉到255fps最大值，不然性能会受影响。（跟影驰沟通过，后续版本这个功能应该不会再默认锁定30fps了）

　　此外，魔盘K还支持核心电压调整，默认0.987V，最大1.2V，不过现在还不能调节显存电压。

　　其它功能不再一一介绍，下面来看一下超频结果。

首先增加144MHz，核心频率达到1150MHz，轻松通过（点击放大）

　　先是很小心地尝试加了144MHz，核心频率提高到1150MHz，Boost频率已经达到1203MHz了，结果很轻松地过了3Dmark 11，得分P10589，提升了10.5%。

直接拉到200MHz也没问题（点击放大）

　　直接提升200MHz之后核心频率已经达到1206MHz，Boost频率1259MHz，通过测试也没问题，此时得分为P10891，相比原来提升了13.6%。

　　目前为止1206MHz是最高了，因为魔盘K现在只能加这么多，但是GTX 680的超频潜力显然还没到顶，目前这个超频状态还是没有加压、没有改默认风扇转速的情况下实现的，一旦后续软件更新的话，那么GTX 680的超频能力才有机会进一步释放。

　　超频到这里还只是开始，前面的超频只调节了核心频率，显存频率未动，那么核心和显存一起超频，最高能到多少呢？

超频最终结果登场，显存达到1815MHz（点击放大）

　　核心频率可以达到1206MHz，显存频率达到1815MHz（等效7260MHz），分数提高到P11182，比原始性能提高了16.6%。

　　HD 7970的显存超频能力也很强，不过之前的几款显卡最高也只能在加压到1.7V电压后超到1770MHz左右，依然是GTX 680胜出。

　　另外，由于GTX 680动态超频技术的存在，GPU-Z里显示的频率实际上要比真实频率要低，比如前面超频到1206MHz之后，在游戏测试中实际运行在1270MHz。

实际运行频率其实要高于GPU-Z显示的（点击放大）

　　上面是循环运行3DMark 11测试的细节截图，GPU-Z显示频率只有1206MHz，但是影驰魔盘K实时捕捉的频率显示为1270MHz，换句话说就是表面上只超到1206MHz，但是实际频率已经达到了1.27GHz。

　　AMD HD 7970显卡给人印象最深的地方之一就是超频能力强劲，不过默电能上1.2GHz也的看运气，还得调高风扇转速忍受噪音，而GTX 680的超频表现很快就让HD 7970的超频能力黯淡了下去。

　　即使因为超频软件的限制，GTX 680也能在默认0.987V电压下达到1.2-1.27GHz的频率，最主要的是风扇不需调速，依然只有轻微的运行声音。再考虑到公版显卡的PCB做工其实很烂，如果日后开放非公版，我们大可以期待GTX 680能创造新的超频记录，1.3GHz应该只是门槛，液冷才能达到的1.4-1.5G或许能在风冷条件下实现。

◆ GTX 680:全方位的进步，完美的性价比

　　GTX 680在性能上扳回了一局，夺回了性能王者地位。3DMark 11的理论测试中表现比HD 7970更猛，P和X模式都有20%的以上提升。实际游戏中有三个项目输给HD 7970，其他项目都或多或少都赢了，平均下来就是比HD 7970领先10%的样子。

　　当然，GTX 680也有比不过HD 7970的地方，GPU计算性能上输多赢少，特别是涉及双精度运算的地方差距还非常大，HD 7970的高速数据吞吐能力、超高带宽还是GTX 680比不上的。

　　惊爆眼球的地方其实并非性能，而是GTX 680的功耗控制，轻负载测试中只比HD 7970高10-20W，如果剥去HD 7970的电源控制，那么GTX 680的实际功耗要比HD 7970还要低，个人觉得这里的翻盘才是GTX 680最值得夸奖的地方，几年来的功耗大户的帽子终于甩掉了。

　　与之对应的是温度和静音，温度上比HD 7970的还是要高几度，但是静音水平上完胜，游戏和拷机时GTX 680都只有轻微的风扇声，而HD 7970则有明显的风扇声，二者一对比就会觉得HD 7970很吵了，因为HD 7970为了温度牺牲了静音，GTX 680则是为了静音牺牲了一点温度，两相比较还是觉得静音更重要。

　　超频性能上GTX 680再次给人以惊喜，不加压的情况下都可以跑到1.2GHz，再算上GPU Boost的加速，实际运行频率达到了1.27GHz，日后放宽频率限制的话估计上1.3-1.4GHz是没问题的。

　　最后的关键因素是价格，GTX 680的国外定价也是499美元(文章完成时一直都说是549美元），不过国内售价只有3999元，比AMD当初的4299-4699元厚道的多。在性能、功耗、超频等方面全面压制对手的情况下，GTX 680的定价还比HD 7970更低，估计AMD很快要大降价了。

　　GeForce GTX 680相比前辈GTX 580是有着全面的进步的，即便与HD 7970相比，它在性能、功耗、超频以及静音上也是胜出的，再算上3999元的价格，整体表现堪称完美，只不过这个完美我更愿意送给GK104芯片，公版GTX 680显卡还有一点瑕疵让人耿耿于怀，作为旗舰显卡的GTX 680 PCB用料应该可以更好一些。

　　鉴于GTX 680在性能、功耗控制、超频以及性价比上的突出表现，我们授予GTX 680显卡“超能网2012推荐奖”，NVIDIA这次的表现真的很给力。

已有 76 条评论，共 145 人参与。

请登录或快速注册后发表评论

游客 2016-03-30 14:23

该评论年代久远，荒废失修，暂不可见。
已有1次举报
支持(3) | 反对(1) | 举报 | 回复

76#

游客 2016-03-26 02:49

该评论年代久远，荒废失修，暂不可见。
已有1次举报
支持(2) | 反对(1) | 举报 | 回复

75#

游客 2016-03-08 19:51

该评论年代久远，荒废失修，暂不可见。
已有1次举报
支持(1) | 反对(1) | 举报 | 回复

74#

游客 2015-09-29 15:51

该评论年代久远，荒废失修，暂不可见。
已有3次举报
支持(1) | 反对(0) | 举报 | 回复

73#

游客 2015-06-13 11:05

该评论年代久远，荒废失修，暂不可见。
已有1次举报
支持(1) | 反对(0) | 举报 | 回复

72#

我匿名了 2012-05-19 19:10

该评论年代久远，荒废失修，暂不可见。
已有1次举报
支持(1) | 反对(0) | 举报 | 回复

71#

游客 2012-04-10 14:53

该评论年代久远，荒废失修，暂不可见。
已有1次举报
支持(2) | 反对(1) | 举报 | 回复

70#

超能网友小学生 2012-03-30 13:07 | 加入黑名单

该评论年代久远，荒废失修，暂不可见。
已有1次举报
支持(2) | 反对(1) | 举报 | 回复

69#

游客 2012-03-29 17:31

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(1) | 反对(0) | 举报 | 回复

68#

游客 2012-03-27 22:36

该评论年代久远，荒废失修，暂不可见。
已有1次举报
支持(2) | 反对(0) | 举报 | 回复

67#

超能网友管理员 2012-03-27 10:08 | 加入黑名单

该评论年代久远，荒废失修，暂不可见。
已有1次举报
支持(1) | 反对(0) | 举报 | 回复

66#

游客 2012-03-27 01:02

该评论年代久远，荒废失修，暂不可见。
已有1次举报
支持(16) | 反对(4) | 举报 | 回复

65#

游客 2012-03-25 17:19

该评论年代久远，荒废失修，暂不可见。
已有1次举报
支持(1) | 反对(0) | 举报 | 回复

64#

游客 2012-03-25 14:02

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(1) | 反对(0) | 举报 | 回复

63#

游客 2012-03-25 11:13

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(3) | 反对(1) | 举报 | 回复

62#

游客 2012-03-24 23:57

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(0) | 反对(0) | 举报 | 回复

61#

超能网友教授 2012-03-24 20:49 | 加入黑名单

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(1) | 反对(0) | 举报 | 回复

60#

游客 2012-03-24 19:14

该评论年代久远，荒废失修，暂不可见。
已有1次举报
支持(2) | 反对(0) | 举报 | 回复

59#

游客 2012-03-24 17:10

该评论年代久远，荒废失修，暂不可见。
已有2次举报
支持(0) | 反对(0) | 举报 | 回复

58#

游客 2012-03-24 15:58

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(1) | 反对(0) | 举报 | 回复

57#

超能网友终极杀人王 2012-03-24 13:11 | 加入黑名单

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(0) | 反对(0) | 举报 | 回复

56#

超能网友终极杀人王 2012-03-24 12:57 | 加入黑名单

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(0) | 反对(0) | 举报 | 回复

55#

游客 2012-03-24 07:58

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(0) | 反对(0) | 举报 | 回复

54#

超能网友博士 2012-03-23 23:00 | 加入黑名单

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(0) | 反对(0) | 举报 | 回复

53#

超能网友博士 2012-03-23 21:18 | 加入黑名单

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(0) | 反对(0) | 举报 | 回复

52#

游客 2012-03-23 20:00

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(0) | 反对(0) | 举报 | 回复

51#

游客 2012-03-23 17:12

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(0) | 反对(0) | 举报 | 回复

50#

游客 2012-03-23 17:02

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(0) | 反对(0) | 举报 | 回复

49#

游客 2012-03-23 17:02

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(0) | 反对(0) | 举报 | 回复

48#

游客 2012-03-23 15:24

该评论年代久远，荒废失修，暂不可见。
已有0次举报
支持(0) | 反对(0) | 举报 | 回复

47#

加载更多评论

请登录后发表评论，若无帐号可快速注册，请留意评论奖罚说明。

GTX680能否斩杀对手 Kepler上演完美复仇

bolvar发布于 2012-3-22 21:00

游客 2016-03-30 14:23

该评论年代久远，荒废失修，暂不可见。

支持(3) | 反对(1) | 举报 | 回复

76#

游客 2016-03-26 02:49

该评论年代久远，荒废失修，暂不可见。

支持(2) | 反对(1) | 举报 | 回复

75#

游客 2016-03-08 19:51

该评论年代久远，荒废失修，暂不可见。

支持(1) | 反对(1) | 举报 | 回复

74#

游客 2015-09-29 15:51

该评论年代久远，荒废失修，暂不可见。

支持(1) | 反对(0) | 举报 | 回复

73#

游客 2015-06-13 11:05

该评论年代久远，荒废失修，暂不可见。

支持(1) | 反对(0) | 举报 | 回复

72#

我匿名了 2012-05-19 19:10

该评论年代久远，荒废失修，暂不可见。

支持(1) | 反对(0) | 举报 | 回复

71#

游客 2012-04-10 14:53

该评论年代久远，荒废失修，暂不可见。

支持(2) | 反对(1) | 举报 | 回复

70#

超能网友小学生 2012-03-30 13:07 | 加入黑名单

该评论年代久远，荒废失修，暂不可见。

支持(2) | 反对(1) | 举报 | 回复

69#

游客 2012-03-29 17:31

该评论年代久远，荒废失修，暂不可见。

支持(1) | 反对(0) | 举报 | 回复

68#

游客 2012-03-27 22:36

该评论年代久远，荒废失修，暂不可见。

支持(2) | 反对(0) | 举报 | 回复

67#

超能网友管理员 2012-03-27 10:08 | 加入黑名单

该评论年代久远，荒废失修，暂不可见。

支持(1) | 反对(0) | 举报 | 回复

66#

游客 2012-03-27 01:02

该评论年代久远，荒废失修，暂不可见。

支持(16) | 反对(4) | 举报 | 回复

65#

游客 2012-03-25 17:19

该评论年代久远，荒废失修，暂不可见。

支持(1) | 反对(0) | 举报 | 回复

64#

游客 2012-03-25 14:02

该评论年代久远，荒废失修，暂不可见。

支持(1) | 反对(0) | 举报 | 回复

63#

游客 2012-03-25 11:13

该评论年代久远，荒废失修，暂不可见。

支持(3) | 反对(1) | 举报 | 回复

62#

游客 2012-03-24 23:57

该评论年代久远，荒废失修，暂不可见。

支持(0) | 反对(0) | 举报 | 回复

61#

超能网友教授 2012-03-24 20:49 | 加入黑名单

该评论年代久远，荒废失修，暂不可见。

支持(1) | 反对(0) | 举报 | 回复

60#

游客 2012-03-24 19:14

该评论年代久远，荒废失修，暂不可见。

支持(2) | 反对(0) | 举报 | 回复

59#

游客 2012-03-24 17:10

该评论年代久远，荒废失修，暂不可见。

支持(0) | 反对(0) | 举报 | 回复

58#

游客 2012-03-24 15:58

该评论年代久远，荒废失修，暂不可见。