E X P
正努力加载中…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...
      GTX680是NVIDIA全新GPU架构Kepler的桌面顶级图形核心,这颗芯片凝聚了NVIDIA多年来的设计研发实力,同时GTX680也对刚换用新图形架构的AMD Radeon南岛家族显卡做出正面回应。

      作为全新架构的首位承载者,我们看到GTX680编号可能会误认为这是新架构的顶级产品,其实顶级核心代号GK110尚未诞生,而GTX680采用GK104芯片是专为图形游戏应用设计的性能型产品,它在性能、功耗、发热等多个方面追求平衡,最终将GPU核心与显卡的可制造性提升到新高度。

      流言蜚语应该终结了,与对手真刀真枪决战的时候到了。

      自从发布GCN架构的南岛家族显卡之后,AMD一直沐浴在胜利的光环之中,HD 7970显卡不论在3D游戏还是NVIDIA引以为傲的通用计算上都是大跃进一般的提升,而28nm工艺带来的功耗控制以及超频能力也着实让人吃惊,首发优势让AMD占尽上风。

      整个DX11时代,AMD往往占有先发优势,但后发的NVIDIA也能成功翻盘,比如GTX 480 vs HD 5870、GTX 580 vs HD 6970。如今HD 7970当道,NVIDIA的Kepler时隔三个月之后终于追上来了(HD 7970于去年12月22日发布,正好是三个月间隔),期待已久的大战终于开始了。


    GTX 680:决一死战吧,我的宿敌,Radeon君!

      战鼓已经响起,来吧,HD 7970,你已经享受了三个月的美好时光,在你的辉映下我的兄弟GTX 580黯淡无光,功耗更被揭了老底,但是你真正的对手是我,现在的我已经今非昔比,战争才刚刚开始,我要夺回属于我的王者之位!

      目前双方选手已经就位,一方是现在洋洋得意的胜利者,一方是卧薪尝胆归来的复仇者和它受气的小弟,下面来看一下这三位选手的具体情况。

      需要注意的是,GTX 680是否支持DX11.1存疑,虽然0.6.0版GPU-Z显示它支持DX11.1(它同时也把GTX 680识别为PCI-E 2.0 x16带宽),但是NVIDIA的驱动控制面板的信息中依然显示DX11,而且官方文档中似乎也没提及DX11.1支持,因此我们更倾向于GTX 680不支持DX11.1。(看来跟DX10.1一样要跟AMD对着干到底)。

      与GTX 580相比,GTX 680的CUDA核心数高出2倍,总计有1536个,纹理单元也翻倍达到128个,ROP单元则减少到32个,低于GTX 580的48个。规格同样有所精简的还有显存位宽,从384bit降到256bit,但是GTX 680的显存频率达到1502MHz,一举超过AMD的1375MHz,显存总带宽也有192GB/s,比GTX 580还要高一点,不过跟384bit的HD 7970还有一定距离。

      GTX 680最明显的改进是在功耗和核心面积上,后者只有区区294mm2,大大低于GTX 580的520mm2,也低于HD 7970的365mm2,甚至比当前的GF114核心的360mm2还要低很多。TDP更是只有195W,秒杀HD 7970的210W、GTX 580的244W,绝对是NVIDIA自GT200架构以来面积最小、功耗最低的顶级卡核心

      GTX 680一改我们平时对NVIDIA显卡的认识,这还是个高性能、高发热的N卡吗?究竟它背后发生了怎样的变化,CUDA核心连升三级、功耗反而更低,现在就来揭开Kepler的架构之谜吧。

    ◆ Kepler架构解析:3倍核心是怎样练成的

      早前在分析Kepler的架构的文章中,我们就提出了GK104架构像GF100还是像GF114的问题,网上甚至有人根据GK104那1536个CUDA核心的规格PS出了GK104的架构,当然最终的结果是GK104更像GF114那样,GPC和SM单元数量减少,但是每组SM单元容纳的CUDA核心更多。


    GF110架构图

      GF110有为4组GPC,每组下辖4组SM单元,每组SM单元又有32个CUDA核心,总计有512个CUDA核心,64个纹理单元,48个ROP单元,16个曲面细分单元,搭配6组64bit显存控制器,总计384bit位宽,1536MB显存。


    GF114架构

      GF114架构中只有2组GPC单元,SM单元数量也从16组减少到8组,但是每组SM单元的CUDA核心数提高到48个,内存控制器减少到4组,总位宽256bit,曲面细分单元也减少到8组,但是纹理单元依然维持在64个,ROP单元也有32个。

      通过这些优化,GF114架构的核心面积大幅减少,而性能也没有因为规格大减而损失多少。


    GK104的核心透视图

      NVIDIA给出的GK104核心透视图上可以清晰地看到它有8组SM单元,架构上跟GF114更为相似。


    GK104架构图

      从这张图上可以看到GK104有四组GPC单元,每组又由2组SM单元组成---准确来说是SMX单元,NVIDIA对SM的称呼有所变化。

      现在来对比一下GF110、GF114以及GK104架构中的SM/SMX单元变化。


    GF110 SM单元(左)、GF114 SM单元(中)以及GK104 SMX单元(右)对比(点击放大)

      GF110的SM单元有32个CUDA内核,四个SFU单元,16个LD/ST存储单元,64KB L1本地缓存,每组SM单元有4组纹理单元,总计64个纹理单元。另外每组SM还有一个多边形引擎负责曲面细分计算。

      GF114的GPC和SM单元总数砍掉一半,SM还剩8组,但是每组容纳的CUDA内核数增加到48个,SFU单元增加到8个,LD/ST也增加到32个,相应地Dispatch单元也增加了一组,L1缓存依然为64KB,不过纹理单元增加到8个,总数依然维持在64个,不过此时的多边形引擎也没有变化。

      GK104的SMX单元中,NVIDIA大手笔集成了192个CUDA核心,纹理单元也增加到16组,前端渲染单元也增加到四组,同时SFU以及LD/ST单元也是水涨船高,增加到32组,纹理单元再次翻倍,8组SMX单元总计有1536个流处理器、128个纹理单元以及32个ROP单元。


    GK104与GF110规格对比


    每组SM/SMX单元性能对比

      更主要的是内在的变化,从Kepler开始,NVIDIA以往坚持的Core:Shader=1:2的分频模式已经没有了,以前采用这种方式是因为核心频率不能大幅提高,为了提高性能就必须让CUDA的核心频率增加一倍,但是这也意味着更高的能耗。

      GTX 680中NVIDIA将SMX单元中的CUDA核心数提高至原来的3倍,而且核心频率也达到1GHz以上,不再需要Shader异步了,二者将同频运行,有助于降低显卡功耗,因此GTX 680在CUDA数量暴增的同时功耗更低,而每瓦性能比更是提高了一倍。

      还有一个变化就是Polygon多边形引擎升级到2.0,虽然物理单元结构没有变化,但是Kepler的PolyMorph Engines 2.0的每周期性能是GTX 580的两倍多,再加上1006MHz的频率也要比GTX 580高出30%,因此整体性能反而会更强。即便与对手HD 7970相比,NVIDIA宣称GTX 680的曲面细分性能要比后者快4倍。

    ◆ GPU Boost:GPU加速我也行

      Intel和AMD各自为旗下的CPU开发了动态超频技术,简单来说就是在CPU功耗没有达到TDP设定值之前提高CPU频率,视多个内核的负载程度不等也会有不同的频率提升。比如测试用的Core i7-2600K,默认频率为3.4GHz,四核运行最高可以加速到3.5GHz,双核负载下可以加速到3.6GHz,单核应用时最高可以加速到3.8GHz。


    Kepler架构的显卡没有Shader频率,但是多了Boost频率

      现在Kepler显卡也有了类似的动态超频技术,它的技术原理跟CPU相似,在TDP范围内提供更高频率。如上图所示,GTX 680的核心默认频率为1006MHz,Boost频率为1059MHz,高了53MHz。


    Kepler显卡的动态加速技术原理

      一般来说,除了Furmark、OCCT这样的拷机测试中很少有游戏或者测试能使GPU达到全负荷运行的,即便GPU-Z显示百分百的GPU占用也不意味着GPU到顶了。在TDP功耗未到上限时,显卡的BIOS会自动提升核心频率,负载越低可提升的空间就越大,一旦功耗达到TDP值,那么频率也会自动降至标准范围,然后再进入下一个循环。


    3DMark 11负载中GPU加速就会不断调整频率


      这张图就是在3DMark 11的测试中不同的截图拼接起来的,默认的频率为1006MHz,但是运行过程中频率会上升到1045、1058MHz,最高达到1084MHz,比显示的Boost频率还要高。

      此外,GPU Boost在显卡超频的时候依然不会失效,因为NVIDIA设定的默认频率与Boost频率是有一个固定比率的,具体数值大约是1.058,也就是说你超频到1.2GHz,还是会存在一个1.2GHz*1.058=1.27GHz的Boost频率。

    ◆ Bindless Texture:纹理操作不再受限

      Fermi及当前的DX11显卡在读取纹理数据时需要先分配一个“槽”(slot),它位于有着固定大小的binding Table表中。每个shader每周期可以读取的纹理数据基本上取决于slot的数量多少,在DX11 API规范中,每个shader最多只可以同时操作128个纹理数据。


    目前的显卡的纹理操作有总数限制

      Kepler显卡支持Bindless Textures(无束纹理)技术,此时进行纹理数据操作就不需要上面那个多余的步骤了,shader可以直接从显存中读取纹理数据,而且没有数量限制,一个场景内甚至可以有一百万个独一无二的纹理存在。

      另外,使用Bindless Textures除了可以大幅提高纹理的数量,还有一个好处就是可以减少CPU占用率。

      目前Bindless Textures还只应用OpenGL规范中,未来可以通过NVAPI间接实现DX API支持Bindless Textures,后续的DX版本也可能支持直接这一技术。

    ◆ 自适应性同步:游戏更流畅

      游戏里的同步技术,特别是垂直同步技术让人又爱又恨,开启它可以防止画面撕裂,但是很多场合它又会限制帧数导致游戏有卡顿的感觉。


    开启垂直同步,部分场景帧数觉剧降而造成卡顿的感觉


    关闭垂直同步,部分场景又可能存在画面撕裂的可能

      为了解决这种"前怕狼后怕虎"的矛盾,NVIDIA提出了Adaptive VSync(自适应同步)技术,它可以让驱动程序自主决定垂直同步开关与否,避免出现上面的尴尬。


    NVIDAI的Adaptive VSync可以减缓垂直同步开关带来的影响

      当游戏帧数低于60fps时,Adaptive VSync会自动关闭垂直同步以防止帧数卡顿,而当游戏帧数恢复到60fps左右时,垂直同步会再次打开以降低可能的画面撕裂。


    新的300系列驱动已经集成了Adaptive VSync选项

      好消息是NVIDIA的新一代300系列驱动中已经集成了Adaptive VSync选项,而且并非Kepler显卡专属,GTX 400、GTX 500显卡也会提供支持。

      驱动提供了两个级别的选项,Adaptive 以及Adaptive(half refresh rate,半刷新率),后者主要用于显卡性能不强、帧数处于20-50fps之间的情况,此时垂直同步的帧数会锁定在30fps而非通常的60fps。

    ◆ FXAA与TXAA:画质更高,速度更快

      目前显卡的抗锯齿(AA)大都集中在后期处理AA而非传统的硬件AA,后者的典型代表是MSAA(多重采样抗锯齿),不过它的资源消耗很高,性能损失比较大。后期处理AA技术主要有NVIDIA开发的FXAA、AMD发扬光大的MLAA以及SQAA等。

      伴随Kepler显卡的推出,NVIDIA除了继续改善FXAA性能之外,还提出了一种新的名为TXAA的新技术。

    FXAA已经集成到驱动面板中

      此番展示FXAA的Demo是EPIC在GDC 2012展会上公布的Samaritan demo,这款demo实际上是去年就发布了,不过现在展示的demo增加了FXAA支持。

      
    FXAA与4xMSAA画质对比(点击放大)


    No AA与FXAA画质对比(点击放大)

      以上是Samaritan demo中的FXAA与No AA、4xMSAA的画质对比,结合我们之前多次测过的FXAA性能来看,它确实很有发展潜力,画质与4x MSAA相当,但是速度要快得多。


    300系列驱动开始也集成了FXAA选项

      目前的300系列驱动也很贴心地集成了FXAA选项,终于可以不用在四处找游戏的FXAA补丁了,不过需要注意的是已经支持FXAA的游戏如《蝙蝠侠》、《战地3》、《上古卷轴5》这个选项是不能开启的,《Far Cry 2》这样原本不支持FXAA的倒是可以开启。

      另外,FXAA也不是一成不变的,从《柯南时代》最早应用以来,已经发展出偏重画质的FXAA 1、FXAA 2以及侧重速度的FXAA 3等多个级别,目前的游戏支持的FXAA主要是FXAA 1或者速度更快的FXAA 3,而驱动中提供的FXAA介于FXAA 1和FXAA 3之间,画质比FXAA 3更高,不过速度比FXAA 3要低一些。

    TXAA投石问路

      TXAA是伴随Kepler显卡问世的新型AA,它是工业电影使用的AA技术,可以充分利用Kepler的FP16纹理性能。TXAA混合了硬件MSAA、CG电影AA的优点,而2x TXAA会有更高的画质。

      构成TXAA的基础是一种高画质过滤器(resolve filter),主要用在后期处理中进行HDR纠正。

      以下三张是8x MSAA、No AA以及TXAA的画质对比图,点击放大。

      TXAA有两种主要类型,TXAA 1和TXAA 2,前者的画质相当于8x MSAA而速度可与2x MSAA相媲美,而TXAA 2的画质要高于8x MSAA,但是速度相当于4x MSAA。

      现在的游戏还不支持TXAA,不过今年晚些时候发布的游戏和引擎如MechWarrior Online、Secret World、 Eve Online、Borderlands 2,、Unreal 4 Engine、 BitSquid、 Slant Six Games以及 Crytek将会支持TXAA,未来更希望TXAA也能像FXAA那样集成到驱动面板中。

    ◆ 编码专用单元,全新3+1屏幕组合

      与HD 7970一样,Kepler显卡也支持最新的多种显示技术规范,比如4K分辨率、3GHz HDMI,multi-stream audio多音频流,并改进了视频转码性能。

    NVENC编码加速单元

      视频编码加速是最具实用性的GPU加速技术之一,之前NVIDIA的显卡使用的大都是基于CUDA加速的方案,虽然CUDA转码速度快,但是存在大材小用、浪费功耗的问题。在Kepler身上,NVIDIA又增加了全新的专用编码单元以大幅提升编码速度。

      Kepler设计了专门的转码单元,整体概念类似Intel SNB架构中的Quick sync转码单元,它支持H.264规范,编码速度比使用CUDA加速要快3倍。此外,软件可以自己选择使用CUDA加速还是使用这个专用转码单元,或者同时使用这两种加速方法。

    NVENC主要特性

    1:以8x或更高的实时比例编码1080p视频,比如16分钟时长、30fps的1080p视频重编码时间只需要2分钟时间。

    2.支持H.264 Base, Main, and High Profile Level 4.1规范。

    3.支持蓝光3D使用的MVC立体视频。

    4.支持4K分辨率。

       目前NVIDIA主要通过授权API、提供SDK的方式推广NVENC编码,现在支持NVENC编码的主要是新版本MediaEspresso软件,后面我们也有专门的转码测试。

    单卡支持3D Vision Surround模式

      目前NVIDIA的显卡要想实现3D Vision Surround至少需要2张卡SLI,相比AMD的宽域多屏技术不够灵活。随着Kepler的发布,NVIDAI也终于实现了单卡实现3D Vision Surround了。

    3+1多屏组合

      另一个重要的改进就是多屏输出,GTX 680的接口中有2个双链DVI、1个HDMI以及1个DP,其中前三个接口可以组建三屏模式,余下的DP接口还可以再接一个显示器组成3+1多屏模式,下面的三个显示器可以玩游戏,而上面的显示器可以用来聊天、收发邮件之类的工作。


    多屏模式下可以将任务栏放置在中间的显示器底部


    边框修正以及边框Peak

      多屏游戏有个恼人的问题就是显示器边框会遮挡游戏内容,Kepler支持边框修正,可以将遮挡的部分显示出来。还有就是边框Peak,使用快捷键调出被隐藏的界面。


    我们也初步体验了一下GTX 680的单卡三屏

      我们也尝试了GTX 680的三屏模式,单卡确实可以组建5760超大分辨率屏幕,不过这次时间紧迫,显卡周转的频繁,没能深入体验,以后还会有更详细的体验文章。

    ◆ 公版GTX 680外观赏


    NVIDIA GTX 680显卡

      在其他高端卡忙着增重增长的同时,GTX 680给人的感觉是变秀气了,PCB长度减少到25cm,820g的重量也要低于GTX 580的890g,更低于HD 7970的1010g。


    这个角度也能看出GTX 680确实变短了


    边缘位置印的logo也比前代更明显


    独特的6pin排列方式

      GTX 680的供电接口不仅从GTX 580的8pin+6pin“简化”到双6pin,而且这两个6pin接口的排列方式也不再是平行的,而是上下叠加,方式很新颖。有人觉得这种排列方式更节省空间,不过我觉得跟传统的双6pin排列是一样的。

      至于有人担心因为两个接口相对排列而带来接口不易插拔的问题,使用中并没发现这个困扰,这两个接口错开了一定位置,只要先拔上面的接口就不会有问题。


    视频输出接口

      接口方面,之前NVIDIA公版卡的标准搭配是双链DVI+mini HDMI,GTX 680除了双链DVI之外,还提供了HDMI以及DP,虽然接口数量上还比不过HD 7970,好歹也进步了许多。

      另外,GTX 680单卡支持三屏输出,使用DP接口的话还可以组建4+1方式的多屏。

    ◆ 公版GTX 680散热器拆解

      在GTX 580甚至之前的GTX 480,NVIDIA显卡的功耗和发热比较高,公版散热器的表现只能用高温高噪音来形容,以致于NVIDIA动用了硬件监控电路以强制降低显卡功耗。

      GTX 680的TDP只有195W,核心也只有294mm2,这两项指标甚至比HD 7970还要优秀,散热器终于有翻身的机会了。


    官方的资料称GTX 680的散热器为静音设计


    散热器主体

      散热器的主要架构跟之前的GTX 580相比其实没有太大变化,依然是涡轮风扇、铝质鳍片、导风罩以及辅助钢板。


    拆掉导风罩后的样子
     


    散热器的三大组件


    铝质鳍片+均热板,唯一的变化是底部也没有凸起了


    钢板覆盖了大部分PCB面积,可以起到辅助散热的作用


    涡轮风扇,上面没找到标签,,只知道是酷冷代工,看不到具体的信息,实测发现声音并不吵

      虽然NVIDIA宣称新散热器的效果如何好,不过对比了之前GTX 580的公版散热器,二者的结构大同小异,散热器的静音主要应该是受惠于GTX 680的功耗大幅降低。

    GTX 680 PCB与GTX 580对比


    NVIDIA GTX 680与GTX 580 正面PCB对比(点击放大)

      与前辈GTX 580的PCB相比,GTX 680的长度只有25cm(10英寸),比GTX 580以及HD 7970的26.7cm(10.5英寸),这也是近几年来旗舰级显卡首次缩短PCB。

      GTX 680的GK104核心面积显著缩小,已经用不着GF100那样的金属盖来加强散热了,二者差异明显。另外,GTX 680是2GB显存,核心周围只布置了8颗显存,而GTX 580是1536MB,但是显存颗粒有12颗,排列的比GTX 680要紧密。

      右侧的供电电路部分,GTX 680由GTX 580的6+2相减少到4+2相,核心部分的四相供电元件也倾斜90度变成横向排列了。


    NVIDIA GTX 680与GTX 580 背部PCB对比(点击放大)

      这是二者背部PCB的对比,GTX 680的核心处滤波电容要少几颗,整体的感觉就是GTX 680更“简洁、光滑”一些,不像顶级卡的风格啊。

      核心编号为GK104-400,A2步进,台积电TSMC 28nm工艺制造,长宽分别为18.7mm、16.8mm,表面积为314mm2,实际核心面积为294mm2,看来之前那位用PS计算出GTX 680面积为320mm2的同学算的还蛮准的。


    显存颗粒来自Hynix

      显存颗粒也是来自Hynix,编号H5GQ2H24MFR,单颗32bit位宽,2Gb容量,跟HD 7970使用的是一样的,R0C后缀表明其频率为6GHz,实际运行频率为1502MHz,远远高于Fermi时代NVIDIA显卡的显存运行频率,要知道GTX 580才是1002MHz(等效4008MHz)。


    4+2相供电

      GTX 680的功耗以及核心面积大降,因此供电电路要求也没这么高了。公版标配只有4+2相,4相为GPU主供电,2相为显存供电。从图中可以看到有1相是虚焊的,之前泄露的PCB上显示是5+2相供电的。


    供电PWM芯片

      供电PWM芯片为RT8802A,台湾立琦公司出品,支持2/3/4/5相供电自动管理。

      核心的4相使用了立隆固态电容、R22贴片电感以及1上2下MOSFET,上桥为4939N,下桥为两颗4935N,安森美出品,Super SO-8封装。


    显存2相供电

      显存的2相独立供电使用的是ECR12固态电容、eR33电感以及1上1下MOSFET,上桥为MDU1514,下桥为MDU1516,韩国Magna公司出品,PowerDFN56封装。

      总的来看,GTX 680作为一款售价4000元的显卡,PCB做工与用料真的一般般,很多几百元显卡的用料都比它还好,NVIDIA真是省到家了。当然,我们也不是唯用料论,供电的简化说明显卡的要求更低了,这对消费者来说是好事。对用料要求较高的玩家只能等待厂商的各种超公版了。

    ◆ 影驰GTX 680赏析


    影驰GTX 680表面没有花哨的贴纸,只在左上角有个影驰的logo


    接口也是公版的四个数字输出接口


    摄影师henery出境了


    PCB背面


    显卡包装

    ◆ 索泰GTX 680赏析


    索泰GTX 680也是公版设计,换了索泰风格的黄色贴纸


    显卡包装不同于索泰以往的风格,有点小清新

    ◆ 昂达GTX 680典范版赏析


    昂达GTX 680显卡


    输出接口


    散热器


    PCB供电设计


    GK104-400核心


    Hynix的GDDR5颗粒


    显卡包装

    ◆ 映众GTX 680赏析


    映众GTX 680游戏高手显卡


    映众是唯一一个换了PCB颜色的,虽然也是公版设计,但是PCB是映众自己生产的


    也是RT8802A PWM芯片,表明它也是公版设计


    显卡包装

    ◆ 耕昇GTX 680关羽版赏析


    耕昇GTX 680关羽版


    显卡包装


    显卡包装及附件

    ◆ 北影GTX 680赏析


    北影也在第一时间推出了自家的GTX 680显卡
     

    ◆ 华硕GTX 680赏析

    ◆ 微星GTX 680图赏

    ◆ 测试平台图赏

      测试平台为Core i7-2600K,1.4V电压下超频到4.8GHz,内存为四条芝奇DDR3 1600,总容量16GB,散热器为Super Mega,搭配12cm静音风扇。


    测试平台(点击放大)


    另一角度

      为了统一日后的温度测试,机箱将固定为振华SF-1000,开启2个前置风扇,后置风扇以及顶置的20cm风扇。


    振华SF-600P14PE电源

      随着NVIDIA显卡功耗的大幅下降,测试根本就不需要再搭配800W或者1000W的电源了,600W金牌电源即可,不过这款电源是非模组化设计,理线麻烦了点。


    测试对比了GTX 580GTX 680以及HD 7970三款显卡


    从这个角度可以看到GTX 680是最小巧的


    实际上GTX 580和HD 7970的PCB是一样长的,不过HD 7970的导风罩更长,显得更大

    ◆ 测试平台详细说明

      测试平台配置为Core i7-2600K,并在1.4V电压下稳定超频至4.8GHz(48x100MHz),搭配四条芝奇DDR3 1600 4GB内存,总计16GB,时序为9-9-9-24,对比测试了HD 7970以及GTX 580两款显卡。

      软件平台为Win7 X64 SP1,HD 7970使用12.2 WHQL驱动,GTX 580在功耗以及温度测试时使用的是266.58驱动以破解功耗保护,性能测试时使用最新的296.10 WHQL驱动。GTX 680使用的是300.99 beta驱动。

      测试的主要项目依然分为游戏性能以及计算性能,并做了一些调整,增加了DX11游戏的比重,并针对曲面细分、FXAA做了针对性测试。计算性能测试增加了MediaEspresso转码对比,转码功能比其他的OpenCL测试要实用的多。

    曲面细分性能:GTX 680以少胜多

      进入DX11时代之后,AMD与NVIDIA就曲面细分性能交火不止一次两次了,每次发布新架构显卡都有针对曲面细分所做的改进,AMD称HD 7970上的曲面细分单元已是第九代,数据吞吐能力比HD 6900系列提高4倍多。对NVIDIA来说,Fermi架构每组SM单元有一个多边形单元,总计拥有16个多边形单元,而Kepler有8组SM单元,多边形单元数量减少到8个,但是性能反而更强。

      曲面细分性能测试选择了微软DX11 SDK自带的Sub11测试以及Heaven 3.0,前者功能专一,所以只调整分辨率至2560x1600,后者还要涉及其他DX11特性,所以分辨率为1920x1080,High画质,依次开启四个曲面细分级别。

      纯理论的曲面细分性能中,GTX 680有392.7帧,比GTX 580的227.2帧高了73%,进步明显,不过比HD 7970的475.2帧要低17%。

      曲面细分性能并不能单独独立于DX11特性之外,如果放在实际游戏中,GTX 580从禁用曲面细分到最高级的曲面细分性能损失了40%,HD 7970损失了45%,而GTX 680损失了39%,稍微领先了一点。

      这意味着虽然GTX 680的多边形单元数量减少了一半,但是实际性能比前代还要大幅胜出,理论性能比HD 7970要低一些,一旦综合到DX11特性中差距并不明显。

    ◆ FXAA性能:比GTX 580快一倍

      FXAA的讨论以及测试我们做过了很多,相比大量耗费资源的MSAA,FXAA性能损失更少,速度更快,而画质不相上下。作为FXAA的开发者,NVIDIA对FXAA的支持也不遗余力,300.99驱动面板中已经集成了FXAA开关,可以强制在游戏中使用FXAA。

      FXAA的测试选择了NVIDIA官网的一个类似DX11 SDK的小工具,另外还有游戏《Batman:Arkham City》,后者支持三种级别的FXAA设置,游戏设置在1920x1080分辨率、DX11模式、Very High画质下。

      这个理论性的FXAA测试中GTX 680相比GTX 580优势明显,性能提升了98%,接近一倍,当然比HD 7970要低7帧,二者差距甚微。

      实际游戏中效果更不明显了,在《Batman》游戏中开启FXAA与否对帧数影响很小,GTX 580只损失了4%的性能,HD 7970的性能损失为7.4%,GTX 680损失了3.7%,看来作为技术的提出者NVIDIA显然还是有一点先天优势的。

    ◆ 计算性能:GTX 680喜中带忧

      自从GCN架构也将计算性能作为重点之后,AMD与NVIDIA又多了一个战场,谁又是新的计算性能王者呢?

      MediaEspresso 6.5测试选择的是一段1080p分辨率的VC-1片段转成1280x720p的H.264影片,各自开启相应的硬件加速技术。

      首先是超频到4.8GHz的四核八线程CPU,用时52秒,GTX 580用时40秒,HD 7970用时45秒,到了GTX 680身上用时缩短至32秒,GPU加速性能上GTX 680再次领先。

      Compute Mark测试中GTX 680大幅领先GTX 580,但是对阵HD 7970已经有了败绩,差了300多分。这是测试误差还是软件支持不够好?

      在GPC Benchmark测试中,GTX 680的单精度性能相比GTX 580无悬念地再次胜出,但是与HD 7970相比,单精度运算低了28%,但是双精度以及密码运算上差距悬殊,只有HD 7970的七分之一到三分之一。

      在LuxMark 2.0的测试中,特意选择最复杂的Room室内场景,GTX 680只有278分,不仅大大低于HD 7970的1028分,也没有超过GTX 580的408分。

      GPU计算中还有Sandra 2012的相关测试,结果也类似,GTX 680的单精度性能比GTX 580要强,但是双精度性能上不仅大大低于HD 7970,甚至比GTX 580还要低。

      现在AMD和NVIDIA的位置似乎颠倒了,AMD的显卡在计算性能上发力,而GTX 680反倒退步了。当然,这只是策略的调整,GTX 680只是一款显卡,上一代的Fermi为了计算性能所做的改进比如多级L1、L2缓存都会占据更多的核心面积,但是对游戏来说意义并不大。GTX 680的游戏性能确实更强了,而计算性能并非普通消费者关注的,另外更具实用性的编码加速性能上GTX 680并没有退步。

      高性能HPC已经是NVIDIA的一大重点,如果是针对计算市场的Tesla分支的GTX 680肯定还会加强,只是这个就不在我们的讨论之内了。

    GTX 680 vs GTX 580:游戏性能完胜

      相对GTX 580来说,GTX 680在游戏性能上全面领先,特别是最新的DX11项目中大幅领先,3DMark 11 P和X模式下高出50%还多,其他DX11游戏中如《战地3》、《蝙蝠侠》以及《Crysis 2》中普遍也有20-40%的领先。

      至于计算性能,MediaEspresso转码测试中比GTX 580更快,Compute Mark中也高了54%,不过双精度运算上比GTX 580还要低。

    GTX 680 vs HD 7970:游戏性能小胜,计算失利

      真正的对决来了。

      与AMD阵营的拳头显卡HD 7970相比,GTX 680有好有坏。好的方面是,游戏性能要高一点,而3DMark 11这样的测试中甚至会高20%以上。不过在《Metro 2033》、《Crysis 2》以及《Alien vs Predator》游戏中败给了HD 7970,差距在8-15%左右。

      计算性能上GTX 680没能超越HD 7970,虽然MediaEspresso以及DirectCompute上领先了,但是其他测试中还是大比分落后于HD 7970,毕竟GTX 680不像Fermi那样身兼多职。

      综合下来,GTX 680的游戏性能比HD 7970还是要领先9%左右,NVIDIA再次夺回性能王者,虽然领先优势相比GTX 580对阵HD 6970的时代在缩小。(不知道AMD会不会后悔没把HD 7970的频率定在1GHz以上)。

    ◆ 温度与噪音:公版卡不再是吵闹的代名词

      温度测试封箱进行,机箱为振华SF-1000,开启两个前置12cm风扇、后置12cm风扇以及顶置20cm风扇。这几天气温回升,室温在23-24°C。

      测试状态为待机、3DMark 11图形测试4循环以及1920x1080分辨率Furmark拷机,同时拷机情况下额外增加了HD 7970的电源控制选项,否则驱动会在测试中自动降频。

      注意:功耗和温度测试中GTX 580使用的266.58驱动以破解功耗保护,性能测试部分使用的是最新的296.10驱动。

      待机时GTX 680只有37°C,比HD 7970要低2度,比前辈GTX 580低了5度之多,待机状态下三款显卡都很安静,没有声音。

      3Dmark 11负载下,HD 7970只有73°C,GTX 680有80°C,GTX 580已经升到84°C,同时也声音最吵的,HD 7970也有明显的风扇声,GTX 680转速在2300RPM左右,不过只有轻微的风扇声。

      Furmark拷机下,GTX 580不用说又是温度最高的,转速达到3200转以上,噪音非常明显。HD 7970的拷机温度为80°C,放开电源限制后升到83°C,同时也有明显的风扇运转声。此时GTX 680的温度达到了85°C,比HD 7970要高一点,不过噪音要比HD 7970低,依然只有轻微的风扇声。

      总体来看,除了待机温度之外,公版GTX 680的温度控制比GTX 580有了长足进步,要比HD 7970要差一点,不过噪音控制的很好,甚至可以是几代旗舰显卡中表现最好的,拷机时也只有轻微的风扇声。

    ◆ 功耗:GTX 680翻身,地位逆转

      NVIDIA公布的GTX 680 TDP只有195W,而且GTX 680一改以往高端显卡6pin+8pin的供电接口的传统只使用两个6pin即可(不过供电接口规格高并不意味着功耗就一定高),那么曾经高功耗的N卡真的要变天了吗?

      待机功耗上它与HD 7970相差不大,基本是同一量级,都大大低于GTX 580的126W。

      3DMark 11中GTX 580继续大幅“领先”,HD 7970的整机功耗为249W,GTX 680约为262W,高了13W左右。

      Furmark拷机中GTX 680的331W也要比HD 7970的308W高23W,不过一旦HD 7970剥去电源控制的外衣,其功耗也会大幅增加到361W,这时GTX 680会反败为胜,功耗上要低于HD 7970。

      功耗的改善应该是GTX 680最明显的变化,给人觉得也是最重要的变化。以往测试A卡和N卡的时候,总结时大都是这样,(同级别显卡)N卡性能强,但是发热大、功耗高,A卡性能差一点,但是发热小、功耗低,综合表现好。

      巨核心战略使得NV在GT200以及Fermi两代显卡上付出了相当大的代价,想想GTX 480发布时的窘境吧,不过这一切随着GTX 680的到来而逆转了,满载功耗比AMD控制的还要好,士别三日当刮目相待。

    ◆ 超频:Kepler初露锋芒

      28nm制程的显卡一个显著的特点就是核心频率起步很高,AMD已经推出HD 7770以及HD 7870这两款预设频率就过1GHz的显卡,HD 7970也达到了925MHz,如今NVIDIA GTX 680不仅核心频率达到1006MHz,Boost加速频率也有1059MHz,比AMD的还要高。


    NVIDIA官方资料显示GTX 680也可以轻易达到1.2GHz以上

      GTX 680超频遇到的第一个问题是没有超频软件,最新的Afterburner 2.20 beta 14对Kepler支持不完全,识别出的规格也是706/1411/1502MHz,即便开启非官方超频模式之后频率上限也锁定在920MHz,也不能改电压。

      另一个软件Nividia Inspector 1.95.11也是如此,它倒是可以改电压和频率,但是参数识别也不正确,核心频率也显示只有706MHz。

      最后从影驰那里要到开发中的魔盘K,不仅可以正确识别所有参数,而且可以调节电压和频率,其他功能也在不断增加中,影驰总算也走在了超频软件的前列。


    影驰魔盘K已经支持GTX 680调节与超频

      除了性能监控以及超频之外,还有其他如影迷会、驱动下载、性能测试等功能,还有一个神秘功能未知,不过这里只看软件的超频功能。

      不过非常奇怪的是,即便其他参数都是正确的,但是包括魔盘K在内的GPU监控以及调整软件都绕不开“706MHz”这个死结,只有刚刚更新的GPU-Z 0.6.0例外。

      魔盘K的超频界面中,第一行是调节动态频率的,不过它跟核心频率的提升也是同步的,如果增加100MHz的动态频率范围,那么核心频率就会变为1106MHz,Boost频率则为1159MHz。

      魔盘K最大频率调节范围为200MHz,也就是说GTX 680的核心频率可以超到1206MHz,Boost频率1259MHz。

      第二行显示30FPS是新增的功能,它可以锁定Kepler的游戏帧速进而调节显卡的频率达到节能的目的,因为大部分情况下游戏根本不能100%发挥GTX 680的潜力。需要注意的是默认锁定在30fps,如果要超频的话需要拉到255fps最大值,不然性能会受影响。(跟影驰沟通过,后续版本这个功能应该不会再默认锁定30fps了)

      此外,魔盘K还支持核心电压调整,默认0.987V,最大1.2V,不过现在还不能调节显存电压。

      其它功能不再一一介绍,下面来看一下超频结果。


    首先增加144MHz,核心频率达到1150MHz,轻松通过(点击放大)

      先是很小心地尝试加了144MHz,核心频率提高到1150MHz,Boost频率已经达到1203MHz了,结果很轻松地过了3Dmark 11,得分P10589,提升了10.5%。


    直接拉到200MHz也没问题(点击放大)

      直接提升200MHz之后核心频率已经达到1206MHz,Boost频率1259MHz,通过测试也没问题,此时得分为P10891,相比原来提升了13.6%。

      目前为止1206MHz是最高了,因为魔盘K现在只能加这么多,但是GTX 680的超频潜力显然还没到顶,目前这个超频状态还是没有加压、没有改默认风扇转速的情况下实现的,一旦后续软件更新的话,那么GTX 680的超频能力才有机会进一步释放。

      超频到这里还只是开始,前面的超频只调节了核心频率,显存频率未动,那么核心和显存一起超频,最高能到多少呢?


    超频最终结果登场,显存达到1815MHz(点击放大)

      核心频率可以达到1206MHz,显存频率达到1815MHz(等效7260MHz),分数提高到P11182,比原始性能提高了16.6%。

      HD 7970的显存超频能力也很强,不过之前的几款显卡最高也只能在加压到1.7V电压后超到1770MHz左右,依然是GTX 680胜出。

      另外,由于GTX 680动态超频技术的存在,GPU-Z里显示的频率实际上要比真实频率要低,比如前面超频到1206MHz之后,在游戏测试中实际运行在1270MHz。


    实际运行频率其实要高于GPU-Z显示的(点击放大)

      上面是循环运行3DMark 11测试的细节截图,GPU-Z显示频率只有1206MHz,但是影驰魔盘K实时捕捉的频率显示为1270MHz,换句话说就是表面上只超到1206MHz,但是实际频率已经达到了1.27GHz。

      AMD HD 7970显卡给人印象最深的地方之一就是超频能力强劲,不过默电能上1.2GHz也的看运气,还得调高风扇转速忍受噪音,而GTX 680的超频表现很快就让HD 7970的超频能力黯淡了下去。

      即使因为超频软件的限制,GTX 680也能在默认0.987V电压下达到1.2-1.27GHz的频率,最主要的是风扇不需调速,依然只有轻微的运行声音。再考虑到公版显卡的PCB做工其实很烂,如果日后开放非公版,我们大可以期待GTX 680能创造新的超频记录,1.3GHz应该只是门槛,液冷才能达到的1.4-1.5G或许能在风冷条件下实现。

    GTX 680:全方位的进步,完美的性价比

      GTX 680在性能上扳回了一局,夺回了性能王者地位。3DMark 11的理论测试中表现比HD 7970更猛,P和X模式都有20%的以上提升。实际游戏中有三个项目输给HD 7970,其他项目都或多或少都赢了,平均下来就是比HD 7970领先10%的样子。

      当然,GTX 680也有比不过HD 7970的地方,GPU计算性能上输多赢少,特别是涉及双精度运算的地方差距还非常大,HD 7970的高速数据吞吐能力、超高带宽还是GTX 680比不上的。

      惊爆眼球的地方其实并非性能,而是GTX 680的功耗控制,轻负载测试中只比HD 7970高10-20W,如果剥去HD 7970的电源控制,那么GTX 680的实际功耗要比HD 7970还要低,个人觉得这里的翻盘才是GTX 680最值得夸奖的地方,几年来的功耗大户的帽子终于甩掉了。

      与之对应的是温度和静音,温度上比HD 7970的还是要高几度,但是静音水平上完胜,游戏和拷机时GTX 680都只有轻微的风扇声,而HD 7970则有明显的风扇声,二者一对比就会觉得HD 7970很吵了,因为HD 7970为了温度牺牲了静音,GTX 680则是为了静音牺牲了一点温度,两相比较还是觉得静音更重要。

      超频性能上GTX 680再次给人以惊喜,不加压的情况下都可以跑到1.2GHz,再算上GPU Boost的加速,实际运行频率达到了1.27GHz,日后放宽频率限制的话估计上1.3-1.4GHz是没问题的。

      最后的关键因素是价格,GTX 680的国外定价也是499美元(文章完成时一直都说是549美元),不过国内售价只有3999元,比AMD当初的4299-4699元厚道的多。在性能、功耗、超频等方面全面压制对手的情况下,GTX 680的定价还比HD 7970更低,估计AMD很快要大降价了。

      GeForce GTX 680相比前辈GTX 580是有着全面的进步的,即便与HD 7970相比,它在性能、功耗、超频以及静音上也是胜出的,再算上3999元的价格,整体表现堪称完美,只不过这个完美我更愿意送给GK104芯片,公版GTX 680显卡还有一点瑕疵让人耿耿于怀,作为旗舰显卡的GTX 680 PCB用料应该可以更好一些。

      鉴于GTX 680在性能、功耗控制、超频以及性价比上的突出表现,我们授予GTX 680显卡“超能网2012推荐奖”,NVIDIA这次的表现真的很给力。

    ×
    热门文章
    1AMD锐龙Threadripper 3990X处理器评测:128个框框数着玩
    2罗永浩直播带货首秀总交易额1.1亿元,他做到带货一哥了吗?
    3AMD锐龙Threadripper 3990X处理器这么强,我们能用什么来榨干它?
    4抖音在海外太火爆,YouTube要推Shorts短视频app应对
    5Comet Lake-H正式登场:Intel发布第十代酷睿移动标压版处理器
    6超能课堂(222):华为P40 Pro拍照被评世界第一!后置四摄都有什么作用?
    7300Hz刷新率!双屏!ROG枪神4 Plus及冰刃4双屏细节曝光
    8部分Haswell芯片组即将停产,最后一批订单将于明年9月发货
    9疑似三星Note20+跑分曝光:大核3.09GHz,内存却只有8GB
    已有 76 条评论,每一条合规评论都是对我们的褒奖。
    • 游客 2016-03-30 14:23

      成功的人,有1%的可能性,他们去做100%的努力和冒险。

      已有1次举报

      支持(2)  |   反对(0)  |   举报  |   回复

      76#

    • 游客 2016-03-26 02:49

      被别人腾起的灰尘弄得灰头土脸。

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      75#

    • 游客 2016-03-08 19:51

      忍耐是美德;坚忍不拔是一切希望之母。

      已有1次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      74#

    • 游客 2015-09-29 15:51

      鐪熶紶鍗板害鐟滀冀锛屾不鐤楀悇绉嶇柧鐥呫€傜绾︾枟鏁堛€傛棤鏁堜笉鏀朵竴鍒嗛挶銆
      瑜伽治万病 http://m.douban.com/group/topic/79905913/

      已有3次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      73#

    • 游客 2015-06-13 11:05

      Granger Whitelaw | Granger Whitelaw is a well respected ...

      已有1次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      72#

    • 游客 2012-05-19 19:10

      原文由网友 [Guest] 于2012-04-10 14:53:10发表 680只是一块游戏卡,就这么简单!
      +1

      已有1次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      71#

    • 游客 2012-04-10 14:53

      680只是一块游戏卡,就这么简单!

      已有1次举报

      支持(1)  |   反对(1)  |   举报  |   回复

      70#

    • syl007小学生 2012-03-30 13:07

      GTX 680:全方位的进步,完美的性价比 这句不全认同!

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      69#

    • 游客 2012-03-29 17:31

      网友 [Guest] 的原贴:1楼
      GTX680的核心和显存频率是1006、6000 HD7970的核心和显存频率是925、5500 如果把HD7970的超频控制在1006、6000的同频水平 那GTX680跟HD7970的性能差距几乎相当小
      网友 [Guest] 的原贴:2楼
      输了发现频率比较低就要同频比,580和6970不见得同频比
      580是1:2分频的

      支持(0)  |   反对(0)  |   举报  |   回复

      68#

    • 游客 2012-03-27 22:36

      原来如此,谢谢楼下。期待超能网更全面更细致的评测:)

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      67#

    • thesea管理员 2012-03-27 10:08

      网友 [Guest] 的原贴:1楼
      有没有谁告诉我,7970所测出来的性能成绩,到底是对应那个高一些的满载功耗,还是低一些的满载功耗?由于7970有2个满载功耗,但性能成绩只有一个,有些混乱了 第一次上贵网,对比枪手村同主题的文章,可信得太多了!希望贵网的评测是公正、负责的
      网友 [bolvar] 的原贴:2楼
      功耗有两个是因为AMD驱动中有刻意限制功耗的设置,就是那个电源控制+20%的,这个只在furmark这样的拷机软件中效果最显著,频率曲线是波动的,正常游戏很少能达到这样高的功耗要求,所以频率可以一直稳定在925MHz,所以说性能上只有一个
      网友 [Guest] 的原贴:3楼
      电源控制+20%?这是啥意思?结合文章来看,我理解的情况是,a卡在跑furmark时把功耗控制在了某一个非真实的偏低状态,但被小编破解,所以给了破解前和破解后的不同功耗值。如果真是这样,那么从580开始也采用了类似做法的nv,是否也在680中做了同样的事情呢。我想应该是这样的,否则很难解释为什么在跑3dmark和跑furmark时胜负情况会对调。 其实不管3dmark还是furmark,都没有什么意义。真正能有说服力的是游戏中的实际功耗和所对应的性能。可惜这么多测评中,只有驱家的有一个简单的跑crisis的功耗对比。要是能在测试不同游戏fps的同时也给出功耗数据就好了
      电源控制+20%是指PowerTune,这在HD6970上就已出现的技术,GPU可自动根据所运行程序负载程度而在不同的频率间切换,逐级调节频率,从而起到“因地制宜”最大限度节省功耗的作用。+20%的话,可以让它工作在最大功耗下,频率不再波动,恒定在最高频率下,相对来说更真实些。 游戏的功耗,我们接受建议,实际上之前的测试中,我们都会加入3DMark11或少数游戏的功耗值,这次比较匆忙,后面的测试中,尽量加入更多测试的功耗测试。

      已有1次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      66#

    • 游客 2012-03-27 01:02

      网友 [Guest] 的原贴:1楼
      有没有谁告诉我,7970所测出来的性能成绩,到底是对应那个高一些的满载功耗,还是低一些的满载功耗?由于7970有2个满载功耗,但性能成绩只有一个,有些混乱了 第一次上贵网,对比枪手村同主题的文章,可信得太多了!希望贵网的评测是公正、负责的
      网友 [bolvar] 的原贴:2楼
      功耗有两个是因为AMD驱动中有刻意限制功耗的设置,就是那个电源控制+20%的,这个只在furmark这样的拷机软件中效果最显著,频率曲线是波动的,正常游戏很少能达到这样高的功耗要求,所以频率可以一直稳定在925MHz,所以说性能上只有一个
      电源控制+20%?这是啥意思?结合文章来看,我理解的情况是,a卡在跑furmark时把功耗控制在了某一个非真实的偏低状态,但被小编破解,所以给了破解前和破解后的不同功耗值。如果真是这样,那么从580开始也采用了类似做法的nv,是否也在680中做了同样的事情呢。我想应该是这样的,否则很难解释为什么在跑3dmark和跑furmark时胜负情况会对调。 其实不管3dmark还是furmark,都没有什么意义。真正能有说服力的是游戏中的实际功耗和所对应的性能。可惜这么多测评中,只有驱家的有一个简单的跑crisis的功耗对比。要是能在测试不同游戏fps的同时也给出功耗数据就好了

      已有1次举报

      支持(15)  |   反对(4)  |   举报  |   回复

      65#

    • 游客 2012-03-25 17:19

      不缺钱的大款们 上几个 让它们把这宣传费 给收回来先。不满足下他们合伙坑爹的苦心看来是不行了-.-

      已有1次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      64#

    • 游客 2012-03-25 14:02

      网友 [Guest] 的原贴:1楼
      GTX680的核心和显存频率是1006、6000 HD7970的核心和显存频率是925、5500 如果把HD7970的超频控制在1006、6000的同频水平 那GTX680跟HD7970的性能差距几乎相当小
      输了发现频率比较低就要同频比,580和6970不见得同频比

      支持(0)  |   反对(0)  |   举报  |   回复

      63#

    • 游客 2012-03-25 11:13

      网友 [Guest] 的原贴:1楼
      游戏性能上根本就没什么太大差距、价格上也没啥太大差距、通用计算方面还完败~有米搞错啊!3999你妹啊、明明3500的东西、我哥们买的7970才特么3600呀!!艹拟码啊艹拟码...还弄出一大堆噱头想骗谁啊~nv也特么忒无良点儿了吧。。。
      网友 [Guest] 的原贴:2楼
      官方定价都很喜欢定在**99上,实际哪有这么高啊。。。
      实际京东网标价4888,4999

      支持(2)  |   反对(1)  |   举报  |   回复

      62#

    • 游客 2012-03-24 23:57

      gtx680公版用料寨!只好等非公版了。。。。

      支持(0)  |   反对(0)  |   举报  |   回复

      61#

    • zhjook教授 2012-03-24 20:49

      680 tdp只有195 说白了这个就是个中档卡,最初定位类似现在的560ti ,结果amd不给力,就直接给拔了上去当旗舰了

      支持(1)  |   反对(0)  |   举报  |   回复

      60#

    • 游客 2012-03-24 19:14

      果斷入7970

      已有1次举报

      支持(2)  |   反对(0)  |   举报  |   回复

      59#

    • 游客 2012-03-24 17:10

      我敢肯定的是游戏的时候反而是HD7970比较省电,谁他妈没事天天跑甜甜圈,脑子进水了?不过性能也低10%,所以说其实都是半斤八两,好处是价格降下来了,不管A或者N一家独大总不是好的.

      已有1次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      58#

    • 游客 2012-03-24 15:58

      还就没见过这么公正的评测了,赞个

      支持(1)  |   反对(0)  |   举报  |   回复

      57#

    • bolvar终极杀人王 2012-03-24 13:11

      网友 [Guest] 的原贴:1楼
      通用计算 在很多测试中OpenGL测试中比HD7970差是因为驱动的原因。构架底层延展测试:Fluid simulation 由于300.99驱动对OpenCL的支持存在问题,同时GPU Boost对于频率的调节会干扰底层运算性能的“纯净度”,因此在本次的构架底层性能延展测试环节中,我们决定放弃基于OpenCL的通用计算测试软件——GPCBenchmark,改用DirectX SDK来完成底层性能数据的收集。待到NVIDIA的官方驱动能够提供正确的OpenCL支持以及可以关闭GPU Boost的设置之后,我们将会补上GPCBenchmark的相关测试。  我们首先进行的DirectX SDK测试,是使用Direct Compute完成的流体力学模拟——Fluid dynamics simulation。Fluid dynamics simulation基于弹性力/黏着力/重力为基础的颗粒碰撞模拟,每一个颗粒均拥有独立的力学参数,通过对颗粒本身在统一的重力参数作用下自有力学参数以及交互作用的计算,可以模拟大量颗粒的行为并达到模拟由它们构成的“流体”特性的目的。
      你被那些专业名词以及不靠谱的理由给唬住了,国内的评测你可以选择不信,但是看了几篇国外网站的测试,也没见谁说是驱动bug导致GTX 680计算性能比不过HD 7970。从设计上来看,GTX 680跟fermi不一样,并没有那么侧重计算的,L2缓存只有512KB,比fermi的768KB要少,而且双精度浮点运算只有单精度运算的1/24,也有说是1/12的,无论哪种说法都意味着GTX 680的计算性能是弱化了的,只有在单精度运算上,凭借高频率和CUDA数优势还能占点上风。 不信你可以等等以后NVIDIA更新几个版本驱动之后再让他测试一下GTX 680在双精度运算上是否有质的变化。其实想测出GTX 680在计算性能上强过HD 7970也很简单,多跑directcompute以及简单的单精度运算就可以了,不过这样做有意义吗?

      支持(0)  |   反对(0)  |   举报  |   回复

      56#

    • bolvar终极杀人王 2012-03-24 12:57

      网友 [Guest] 的原贴:1楼
      有没有谁告诉我,7970所测出来的性能成绩,到底是对应那个高一些的满载功耗,还是低一些的满载功耗?由于7970有2个满载功耗,但性能成绩只有一个,有些混乱了 第一次上贵网,对比枪手村同主题的文章,可信得太多了!希望贵网的评测是公正、负责的
      功耗有两个是因为AMD驱动中有刻意限制功耗的设置,就是那个电源控制+20%的,这个只在furmark这样的拷机软件中效果最显著,频率曲线是波动的,正常游戏很少能达到这样高的功耗要求,所以频率可以一直稳定在925MHz,所以说性能上只有一个

      支持(0)  |   反对(0)  |   举报  |   回复

      55#

    • 游客 2012-03-24 07:58

      HD7870你快降到1300吧

      支持(0)  |   反对(0)  |   举报  |   回复

      54#

    • 金鹏博士 2012-03-23 23:00

      这是我看到的国内比较客观全面公正的评测,鲜有枪火--赞一个超能

      支持(0)  |   反对(0)  |   举报  |   回复

      53#

    • 爱无界博士 2012-03-23 21:18

      高端卡何谈性价比?3999元还便宜?只是少数人的玩具而已。

      支持(0)  |   反对(0)  |   举报  |   回复

      52#

    • 游客 2012-03-23 20:00

      有没有谁告诉我,7970所测出来的性能成绩,到底是对应那个高一些的满载功耗,还是低一些的满载功耗?由于7970有2个满载功耗,但性能成绩只有一个,有些混乱了 第一次上贵网,对比枪手村同主题的文章,可信得太多了!希望贵网的评测是公正、负责的

      支持(0)  |   反对(0)  |   举报  |   回复

      51#

    • 游客 2012-03-23 17:12

      网友 [Guest] 的原贴:1楼
      游戏性能上根本就没什么太大差距、价格上也没啥太大差距、通用计算方面还完败~有米搞错啊!3999你妹啊、明明3500的东西、我哥们买的7970才特么3600呀!!艹拟码啊艹拟码...还弄出一大堆噱头想骗谁啊~nv也特么忒无良点儿了吧。。。
      官方定价都很喜欢定在**99上,实际哪有这么高啊。。。

      支持(0)  |   反对(0)  |   举报  |   回复

      50#

    • 游客 2012-03-23 17:02

      通用计算 在很多测试中OpenGL测试中比HD7970差是因为驱动的原因。构架底层延展测试:Fluid simulation 由于300.99驱动对OpenCL的支持存在问题,同时GPU Boost对于频率的调节会干扰底层运算性能的“纯净度”,因此在本次的构架底层性能延展测试环节中,我们决定放弃基于OpenCL的通用计算测试软件——GPCBenchmark,改用DirectX SDK来完成底层性能数据的收集。待到NVIDIA的官方驱动能够提供正确的OpenCL支持以及可以关闭GPU Boost的设置之后,我们将会补上GPCBenchmark的相关测试。  我们首先进行的DirectX SDK测试,是使用Direct Compute完成的流体力学模拟——Fluid dynamics simulation。Fluid dynamics simulation基于弹性力/黏着力/重力为基础的颗粒碰撞模拟,每一个颗粒均拥有独立的力学参数,通过对颗粒本身在统一的重力参数作用下自有力学参数以及交互作用的计算,可以模拟大量颗粒的行为并达到模拟由它们构成的“流体”特性的目的。

      支持(0)  |   反对(0)  |   举报  |   回复

      49#

    • 游客 2012-03-23 17:02

      网友 [Guest] 的原贴:1楼
      游戏性能上根本就没什么太大差距、价格上也没啥太大差距、通用计算方面还完败~有米搞错啊!3999你妹啊、明明3500的东西、我哥们买的7970才特么3600呀!!艹拟码啊艹拟码...还弄出一大堆噱头想骗谁啊~nv也特么忒无良点儿了吧。。。
      构架底层延展测试:Fluid simulation 由于300.99驱动对OpenCL的支持存在问题,同时GPU Boost对于频率的调节会干扰底层运算性能的“纯净度”,因此在本次的构架底层性能延展测试环节中,我们决定放弃基于OpenCL的通用计算测试软件——GPCBenchmark,改用DirectX SDK来完成底层性能数据的收集。待到NVIDIA的官方驱动能够提供正确的OpenCL支持以及可以关闭GPU Boost的设置之后,我们将会补上GPCBenchmark的相关测试。  我们首先进行的DirectX SDK测试,是使用Direct Compute完成的流体力学模拟——Fluid dynamics simulation。Fluid dynamics simulation基于弹性力/黏着力/重力为基础的颗粒碰撞模拟,每一个颗粒均拥有独立的力学参数,通过对颗粒本身在统一的重力参数作用下自有力学参数以及交互作用的计算,可以模拟大量颗粒的行为并达到模拟由它们构成的“流体”特性的目的。

      支持(0)  |   反对(0)  |   举报  |   回复

      48#

    • 游客 2012-03-23 15:24

      网友 [Guest] 的原贴:1楼
      总结:游戏N 运算看电影A~完毕
      好回复; 这tm都磕药了,这么狂发预先写好的评论? 哪个来说说GT680的多屏下的“边框补偿模式”没有-----多屏图像变形别扭咋整? 680多屏就这1种模式么? 不能有边框补偿模式么?????

      支持(0)  |   反对(0)  |   举报  |   回复

      47#

    加载更多评论

    我来评论
    为你推荐