传说中只要能越过龙门,就能变成呼风唤雨、为世人敬仰的祥龙,AMD赶在年关之前发布了新一代显卡——Radeon HD 7970,不知是否期待它也能一飞升天。
不过,对AMD来说,Radeon HD 7970的发布意义非凡,它不仅是一次常规的产品升级,这是AMD四年多来首次彻底升级GPU架构,这个架构还有个很长但意思也很直接的名字——Graphics Core Next(以下简称GCN),这个“下一代图形内核”肩负着AMD“保持GPU性能的同时提高GPU计算能力的”重任。
![]() |
Radeon HD 7970只是排头兵,本代的HD 7000系列家族代号“Southern Islands”,成员包括主打高端市场“Tahiti”、定位主流的“Pitcairn”以及性能级的“Cape Verde”三大族系,HD 7970就是Tahiti XT,定位稍低的HD 7950则是Tahiti Pro,后续产品也会陆续铺开。
![]() |
Tahiti下面的标语写着“专为狂热玩家准备的世界上最强大、最先进的GPU”,除了宣传的味道之外,我们也能从中看到AMD的信心,它敢这么说就是因为现在的发布的HD 7970显卡真的就是目前最强的GPU核心,这点也不是什么秘密了,因为国外已经发布过了,大家也看过HD 7970的性能评测了,AMD靠着HD 7970重登显卡性能王位。
HD 7970底气来自实力,代号GCN的显卡构架就是AMD显卡翻身的保证。AMD在去年6月份的Fusion开发者大会上才公布了GCN架构,之前一直没有什么消息,而半年之后基于GCN架构的显卡就已经开始批量上市,HD 7970不仅是首款使用GCN架构的显卡,而且还是第一款支持PCI-E 3.0、第一个支持DX11.1标准、第一个使用TSMC 28nm HP工艺的显卡,,还有它那神奇的不足3W的ZeroCore待机功耗,HD 7970身上的变化可以用一个不那么流行的词来形容了---“太给力了”
HD 7970在国内的定价为4299元,它的对手主要是自家兄弟HD 6970和GTX 580,后两者的售价都不会超过3999元,HD 6970甚至只有2800左右,今天的评测他们几位免不了要混战一番,新架构加持的HD 7970有多少胜算,能否真的如AMD所想的那样谈笑间,强虏灰飞烟灭?
虽然国外已经发布过了,但是为了做好HD 7970的国内发布事宜,我们也做了单独的HD 7970专区,除了这篇评测之外,还有针对性地对HD 7970进行了全面的测试和解析,这里做个综合链接,如果有你感兴趣的内容不妨进去看看,而且专区还有多种活动在等着你的到来呦。
· 图形与计算的融合,AMD GCN架构解析
· 3D技术小步快跑,DX11.1新功能简介
· 显卡步入28nm时代,制程进步的数字化浅析
· 性能大幅提升,HD 7970曲面细分能力测试
· 统一“100”不是梦,HD 7970双卡交火效能测试
· 高速是否高性能,PCI-E 3.0 vs PCI-E 2.0测试
· 小马不拉大车,HD 7970显卡该配什么电源?
· 寻找黄金搭档,玩爽HD 7970显卡需要什么样的CPU?
· AMD HD3D初体验
· AMD Eyefinity 2.0特性应用实践
· 让通用计算走近生活,HD 7970 APP应用程序加速
既然GCN架构有这么多优点,废话不多说,先来了解一下GCN架构的主要特点。
◆ GCN架构:重新定义图形及计算
AMD HD 7970显卡使用的是全新GCN架构,有关GCN架构的解析文章我们之前已经详细分析过,不过现在AMD又更新了一些资料,内容没有之前的技术PDF那么枯燥,可以更加直观地对比新架构的变化。
![]() |
了解一点显卡技术发展历史的读者应该知道,早期的显卡结构很简单,只是几何变换以及光照渲染,后来发展到顶点渲染和像素渲染。DX10时代开始统称为流处理器,AMD就在原来的基础上发展处VLIW 5超长指令架构,使用4D+1D的变通方式实现了统一渲染的要求,VLIW 5从HD 2900开始一直用到HD 3800、HD 4800、HD 5800以及HD 6800,历经五朝而不衰。
2010年的时候AMD发布了HD 6900系列显卡,其架构有所调整,从4D+1D的VLIW 5指令变为4D的VLIW 4指令,增强了流处理器单元的通用性,不过整体范畴还是未能脱离VLIW超长指令体系。
![]() |
VLIW体系的优点是电路设计比较简单,流处理器单元数量扩展起来很方便,缺点就是效率低,极度依赖指令组合,需要强大的调度体系与之配合,实际应用远不如理论那么高效,特别是在GPU计算性能上,AMD的显卡已被对手撇下很远,是时候改变了。
AMD推出了GCN架构,目标不仅是提升GPU图形性能和能效,而且要提高GPU的多线程处理能力,优化高性能计算,提高扩展能力和弹性,并与Fusion架构融合。
![]() |
GCN架构中基本的组成单元为“Compute Unit”(简称CU),完整的GCN核心有32个CU单元,每个CU单元又下辖64个ALU单元和4个TF纹理单元,总计有2048个ALU计算单元,128个纹理单元,相比之下HD 6970的流处理器单元只有1536个,纹理单元也只有96个。
前端部分延续了HD 6970显卡所用的“Dual Graphic Engines”双图形引擎结构,有两个ACE(Asynchronous Compute Engines异步计算引擎)和两个Geometry Engines(几何引擎,第9代曲面细分单元)引擎。
HD 7970还有8个后端渲染单元,每周期可以实现32个ROP光栅渲染和128个Z/stencil渲染,这一点与HD 6970倒是没有分别,不过显存位宽加大了,后端处理性能还是有提升的。
32个CU单元之外是6组GDDR5显存控制器,每组64bit,显存位宽为384bit,这也是AMD首次使用384bit显存位宽,再结合1375MHz的高速度,HD 7970的显存带宽达到了264GB/s,显存容量也再上一个台阶,达到了3GB。
![]() |
AMD对GCN架构的定义为“Non-VLIW ISA With Scalar+Vector Unint”---使用标量&矢量单元的非VLIW体系,它与之前的VLIW架构形似而神不同,显卡的组成单元不再是SIMD阵列而是CU单元,那CU单元具体又是如何构造的?
上图是CU单元的组成示意图,每个CU中有1个标量单元和4个矢量单元,每个矢量单元又是由一组SIMD-16阵列组成,这4组SIMD-16阵列各有64KB寄存器(Registers),并且是独立运算,这样一个CU单元同时就可以执行多条指令,这就是AMD所说的“GCN是基于SIMD阵列的MIMD架构”(Southern Islands is a MIMD architecture with a SIMD array)的含义。
![]() |
与VLIW 4体系的一组SIMD阵列相比,二者的ALU单元总数是相同的,每个CU以及SIMD阵列单元都能执行64个单精度混合乘加运算,好比16*4和4*16都等于64一样,但是区别在于,VLIW 4每次虽然可以执行4个ALU运算,但是每个ALU单元不能独立运算,需要组合成VLIW 4才可以,效率和调度是个问题,而GCN的4 SIMD阵列每周期可以执行1个ALU运算,但是四组SIMD可以互不依赖,只要有进程就一直是100%效率。
GCN架构的这个转变看起来很简单,就像是换个算法而已,但就是这个简单的变换极大地提升了HD 7970的计算效率,不需要在调度和优化下大费周章,创建、分析以及debug过程也更简单,提高了计算的扩展性以及弹性。
◆ 缓存设计:天堑变通途
![]() |
之前的AMD显卡对GPU的多级缓存并不重视,因为缓存对图形计算来说没那么重要,HD 6970虽然也有L1、L2以共享缓存之分,但是大部分缓存操作都是“Read only”,不支持Full R/W读写,不利于数据交换,这对GPU计算影响很大,而GCN的缓存不仅容量更大,而且非常重视数据的即时共享性和可交换性,支持R/W读写操作。
每个CU单元中的一组SIMD阵列各有64KB寄存器缓存,每个CU单元共享64KB本地数据缓存和16KB L1缓存,每4个CU单元再共享16KB指令缓存和32KB标量数据缓存。除了CU之间共享的缓存是只读操作之外,其他L1缓存、数据缓存都是R/W读写的。
上述缓存都会通过64bit界面与L2缓存相连,L2缓存有6组,每组128KB容量,总计有768KB L2缓存,此外L2缓存还可与CPU内存数据同步,HD 7970就支持X86 Virtule Memory(X86虚拟内存)技术,这意味着CPU可以直接访问显存中的数据,大大增强了CPU与GPU之间的数据交换能力。
![]() |
总之,在缓存设计上,GCN架构绝对是华丽变身,不仅增大了L1、L2缓存容量,而且也提升了缓存的可读写操作,各级缓存之间也能即时同步数据,后面的测试也证明了GCN架构的数据吞吐带宽有了极大提高。
◆ 曲面细分:一直在努力
硬件曲面细分(Hardware Tessellation)是DX11中新增的主要标准之一,利用GPU创建不同复杂程度的多边形模型,并自动生成大量顶点以使模型细化,简单来说就是简化了游戏开发者的建模难度而提高了游戏画质,为此支持DX11标准的显卡往往都会设计单独的多边形引擎以作曲面细分之用。
![]() |
曲面细分最早是ATI开发,发展到HD 5800显卡上是第六代,不过NVIDIA的Fermi架构中每个SM单元各有一个多边形引擎,GF100/GF100显卡上最多有16个曲面细分单元,凭借在多边形引擎设计上的领先,NVIDIA显卡的曲面细分性能反超AMD显卡,以致于双方还就真假DX11大打口水仗。
不过打嘴仗的同时AMD也没闲着,从HD 5800系列以来一直在改进曲面细分性能,HD 6800显卡上发展到了第七代曲面细分,曲面细分单元数量没变化,但是算法做了优化,性能有一定提升,而到了HD 6900系列上其曲面细分技术发展到第八代,双引擎的加入使得曲面细分单元增加到2个,并支持片外缓存,AMD声称曲面细分性能相比HD 6800系列最多提升3倍。
![]() |
随着HD 7970的发布,曲面细分性能依然是改进重点,其曲面细分技术也发展到第九代。Gen9也是双引擎单元,数量没有增加,不过功能有优化,片外缓存性能和量再用性能有提高,AMD称HD 7970的曲面细分单元的吞吐能力达到了HD 6900系列的4倍之多。
![]() |
在我们所做的HD 7970曲面细分专项测试中,HD 7970在《Crysis 2》、《Unigine Heaven》、《失落星球2》这样应用曲面细分较多的游戏中性能确实有很大提升,而微软的曲面细分理论测试中HD 7970也是一马当先,足以让人刮目相看。
◆ 其他图形技术改进:DX11.1、PCI-E 3.0、PRT以及24xAA
除了曲面细分这个重头戏之外,HD 7970在其他3D技术同样也有提升,比如率先支持DX11.1规范、第一个支持PCI-E 3.0、支持PRT巨型纹理,并带来24xAA抗锯齿以及更高级的AF纹理过滤性能。
DX11.1:支持3D立体显示
微软虽然没有DX12这样的大版本更新,但是今年的Win8系统上就会支持DX11.1规范,而HD 7970顺利成为第一款支持DX11.1的显卡。
DX11.1只是一次小幅升级,虽然没有革命性的3D技术加入,但是支持通用的3D立体显示、支持TBDR渲染、TIR目标独立光栅化以及双精度浮点运算等技术还是值得一看,详细的介绍可以参看这篇文章。
PCI-E 3.0:带宽翻倍、延迟更低
PCI-E 3.0的信号速率从5GT/s提高到8GT/s,带宽翻了一倍,而HD 7970也是第一款支持PCI-E 3.0标准的显卡。由于目前已经有SNB-E平台的CPU和主板支持PCI-E 3.0规范,现在随着HD 7970的发布,已经形成了三位一体的搭配。
![]() |
在PCI-E 3.0的专项测试中,我们也采用了两种模拟法测试了高带宽对显卡性能的影响,虽然大部分测试性能没有变化,但是仍有几个测试从显卡的高带宽受益,性能有一定提升。
PRT:引领“巨型纹理”新潮
![]() |
HD 7970还引入了PRT技术,全称为Partially Resident Textures(部分贮存纹理)。前面提到HD 7970支持虚拟X86内存功能,它可以将大容量、高带宽GDDR5显存影射为CPU可识别的纹理缓存,这样纹理数据就可以不经过带宽较低的内存,降低了纹理数据载入的不稳定。
![]() |
ID的大神卡马克在ID Tech5引擎的《Rage》游戏中就使用了“Megatexture”巨型纹理技术,所以游戏的容量非常大,足有20G之多,这么大的纹理数据如何处理好可是一个难题。如果游戏开发商能使用PRT技术优化超大纹理数据的处理,那么游戏画质提升就可以从提高纹理数据处入手了。
AA及AF改进:24xAA以及AF纹理性能
随着性能的提升,HD 7970显卡的抗锯齿性能最大提升到24x MSAA/SSAA,当然也没能少了HD 6970上使用的EQAA、目前火热的FXAA以及SMAA等多种抗锯齿支持。
![]() |
AMD改进了HD 7970的AF算法,在不损失性能的前提下新增了过滤内核系数,主要减少了高频纹理的闪烁假象。
上述几项技术更新中,DX11.1、PCI-E 3.0属于常规功能升级,AA和AF性能改进也看不出什么,不过PRT技术很有前途,它降低了超大纹理数据的应用难度,只是PRT需要游戏开发商支持,能否普及还得看技术推广程度。
◆ 宽域2.0与HD3D:看的更多,听得更清
如果单以性能而论,目前的HD 6970也足够在1080p全高清下、高画质下流畅运行绝大多数PC游戏了,更吸引人的还得靠别的,比如多屏游戏、影音或者办公,觉得三屏不够,那么AMD的宽域2.0新增的五屏模式就可以登场了。
![]() |
首先是宽域2.0支持更多的屏幕配置,比如5x1屏幕并排模式,屏幕尺寸也不要求相同,配置更加灵活多样,而且多屏的最大分辨率提高到16k*16k,分辨率也太超前了,短时间6屏幕模式也达不到这个标准了。
![]() |
DDMA:音频独立输出
![]() |
DDMA全称是“独立数字多点音频(Discrete Digital Multi-Point Audio)”,这个功能应该是宽域2.0技术中最具实用性的升级。它能使视频在不同屏幕移动的同时,让音频随之而动,当然这只能在DP或HDMI的影音电缆中进行工作。DDMA的好处是让一台电脑真正实现独立音频输出,而不是将所有音频混音一起输出。有了DDMA,一屏玩游戏,而另一屏看电影就不再会出现交叠的情况;有了DDMA,一屏视频聊天,而另一屏看MTV也不会互相干扰了。
有关宽域2.0的实际体验我们也有专门的文章,有兴趣的同学可以去围观《AMD Eeyfinity 2.0特性应用实践》一文。
AMD显示技术的另一个亮点是HD3D立体体验,目前已经有越来越多的游戏和装备支持AMD的HD3D技术,为了体验一下AMD HD3D技术效果如何,我们还专门购买了一台三星SA950 3D显示器。
![]() |
HD3D玩游戏怎么样?想知道的话就去看看这篇HD3D初体验文章了,内容涵盖了原理、显示设置以及实际体验,对HD3D有意的玩家可以参考一下。
◆ 视频处理及软件加速:GPU加速走进生活
按照以往的情况来看,AMD在推新架构产品的时候对GPU加速一般都是蜻蜓点水,而NVIDIA恰恰相反。不过现在的情况又不一样了,AMD的官方文档中针对GPU加速应用的比重明显增多,因为对GCN架构的HD 7970来说,计算性能有了质变了,而且GPU加速也已成为AMD融合处理器的理念之一。
对AMD显卡来说,GPU加速可以通过自家的Stream通用计算技术实现,也可以通过OpenCL这样公开的计算标准加以支持,前者有各种视频转码软件,比如Cyberlink的Mediaesresso、Mediacoder等转码软件支持,而OpenCL的GPU加速涵盖的范围更广一些,比如播放软件、浏览器甚至地图浏览。
![]() |
![]() |
视频解码编码:新增VCE引擎
另一个不得不提的是AMD HD 7970的视频解码/编码改进,UVD解码引擎与目前的UVD3相比变化不大,但是增加了Dual Stream HD+HD功能,可以同时解码两路HD视频。
视频编码方面就有全新变化了,AMD推出了新的VCE引擎,它的功能类似于Intel在SNB架构CPU中使用的Quick Sync引擎,都是为快速转码准备的。
![]() |
如果是低端显卡,AMD建议全程使用VCE引擎编码,虽然效率低点,但是功耗会比单独使用CPU转码要低。当然,如果是高端显卡,那么VCE引擎只负责最后的墒编码,前面的计算交给OpenCL完成,这样效率会更高。
Steady Video 2.0视频稳定技术
![]() |
Video Steady本来是AMD给APU增加卖点的技术,如今也扩展到新一代显卡上了,版本也提升到2.0,开始支持隔行扫描视频,改进了算法。
视频处理以及软件加速都是非常实用的功能,如果想深入了解一下AMD在这方面的改进,这篇文章说的很详细了。
◆ ZeroCore:性能与功耗的博弈
这几年来每一代代显卡的性能虽然都是在提高,但是显卡的功耗也越来越高,特别是旗舰级的显卡,TDP功耗动辄200W以上,功耗增大又会带来温度和噪音上的连锁问题,如何才能在功耗与性能之间做到平衡呢?
HD 7970支持新一代功耗管理技术---ZeroCore,字面意义上就是“0核”,在空闲的时候可以将GPU核心接近完全关闭,因此得名。AMD给出的数据显示,2009年发布的HD 5800系列待机功耗最低为27W,2010面发布的HD 6800系列待机功耗在24W左右,而到了HD 7970身上待机功耗不足3W。
![]() |
在HD 7970之前,AMD和NVIDIA所谓的待机其实是将显卡降低到一个非常低的频率水平,比如N卡的核心/显存频率最低为50.5/135MHz,AMD的HD 6970最低是250/150MHz,电压也会比正常工作电压要低,但是查看HD 7970的频率设置就会不一样了。
![]() |
HD 7970只有300/150MHz@0.85V以及925/1375MHz@1.17V两种状态,虽然最低频率高了,但是待机电压比HD 6970还要低。而对ZeroCore技术来说,它可以在GPU负载非常低的时候接近关闭GPU核心,待机功耗自然有大幅下降。
AMD的这项技术与CPU中C6级别的深层休眠类似,不过它却是来自AMD笔记本平台的Radeon节能技术,在系统依然活动的情况下关闭GPU核心,只保留一小部分电路用以监视系统状态并唤醒GPU核心,综合下来可以减少95%的待机功耗,所以3W的待机功耗也不足为奇了。
![]() |
由于主要是降低待机功耗,这个功能对多路显卡来说效果最显著,HD 6970的待机功耗在20W左右,那么简单算下,双路CF待机功耗至少要增加20W,三路就是40W,四路就会增加60W,而HD 7970双路CF只会增加3W左右的功耗,三路、四路节省的待机功耗会更多。其中双路待机功耗我是验证过的,跑CF交火的时候双卡待机功耗是87W,而单卡待机时是83W,差值约4W,说明副卡待机时功耗真的是超低。
![]() |
结合后面的功耗测试,HD 7970的功耗表现确实可以用惊艳来形容,待机功耗尤其如此。
◆ 28nm工艺:军功章的另一半
HD 7970显卡能在晶体管规模扩张到43.1亿个之后还能保持210W的TDP功耗以及365mm2的核心面积,除了AMD自身的设计思路之外,TSMC的28nm工艺堪称军功章的另一半,HD 7970的低功耗小面积很大程度上要依赖代工厂的制程工艺。
目前主流显卡使用的还是40nm工艺,而AMD的HD 7900以及NVIDIA的Kepler都将使用台积电(TSMC)28nm工艺,不过TSMC此番升级28nm并不太顺利,因为相比前次55nm到40nm的升级,28nm工艺上使用了很多新技术,风险更大。
![]() |
TSMC的28nm工艺是其首次采用HKMG(高K金属栅)工艺,同时也是首次使用Gate-Last工艺,不仅需要代工厂对工序和制造工艺进行调整,还需要IC设计方对电路的布局进行较大调整,只有这样才可以克服Gate-Last工艺中的一些缺陷,保证新工艺生产出的芯片密度不变,因此迟迟不能量产。
由于进展不够顺利,TSMC也不得不做了一些妥协,推出几种不同的28nm工艺,如HP、HPL、HPM以及LP等。
![]() |
HP工艺才是真正的HKMG+Gate-Last工艺,它又可以分为HP、HPL(Low Power)、HPM(Moblie)三个方向,HP工艺拥有最好的每瓦性能比,频率可达2GHz以上,HPL的漏电流最低,功耗也更低,不过频率只有1.4GHz以上;最后的HPM主要针对移动领域,频率比HPL更高,功耗也略大一些。
工艺简介还只是个引子,更深入的一个问题是如何量化AMD与NVIDIA对工艺的掌握情况,在这篇文章中我们综合了核心面积、TDP功耗、性能以及晶体管规模几个参数,试图用一个数学模型来描述制程工艺进步对显卡的影响,最后的结果也显示受新工艺的影响,HD 7970的综合评分远远高于其他显卡。
◆ 公版HD 7970显卡外观及拆解
![]() |
与前代HD 6970方方正正的造型相比,HD 7970的整体外观要圆滑、细腻一些,尾端采用跑车式的流线造型,PCB长度是一样的,都是26.7cm(10.5英寸)。
![]() |
![]() |
![]() |
散热器底部的显存位置处贴有12片导热贴,值得一提的是铜制核心还特意凸出来以便贴紧GPU核心,从图中看HD 7970的核心面积确实非常小。
![]() |
![]() |
AMD的公版显卡一直是封闭式涡轮散热+均热板方案,HD 7970使用的是第六代均热板技术了,改善了散热效率和噪音水平,特别是涡轮风扇,叶片重新设计,提高了风量。
![]() |
![]() |
散热鳍片有41片,长15.5cm,宽2.4cm,估算总面积约为3050cm2,底部的均热板面积约为16cm*9cm=144cm2。
![]() |
![]() |
涡轮风扇型号为FD7525U12D,直径7.5cm,长寿命双滚珠轴承结构,电流1.70A,最大转速不低于5200转。
◆ 公版HD 7970显卡的PCB布局及用料
![]() |
![]() |
HD 7970显卡的布局与前代HD 6970整体相似,CPU底座改为覆盖式,显存颗粒多了4片,而供电用料变化最大,有原来的6+2+1的数字供电变成了现在的5+1+1数字供电,没了成本高昂的数字排感。
![]() |
![]() |
主供电部分为5+1相,5相核心,1相显存,不过PCB上虚焊了1相供电电路,不知道是不是最初打算设计成5+2相,毕竟HD 7970的显存位宽和显存容量比HD 6970提高了50%之多。
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
编号H5GQ2H24MFR-ROC的Hynix显存颗粒单颗容量2Gb,FBGA 170-Ball封装,使用的是54nm工艺,1.5V下最高数据频率可达6000MHz,默认为5500MHz。
◆ 盈通R7970-3072GD豪华版赏析
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
◆ XFX FX-797A-TDB酷魂黑卡赏析
XFX R7970酷魂黑卡是送测的显卡中唯一一个非公版散热器的,配置了双风扇,散热和静音会比公版有所加强,默认频率也会从公版的925/1375MHz提高到1000/5700MHz。
![]() |
![]() |
![]() |
![]() |
![]() |
|
|
![]() |
![]() |
![]() |
◆ 蓝宝HD 7970显卡赏析
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
◆ 迪兰HD 7970 3G显卡赏析
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
◆ HD 7970显卡图赏之XFX、微星、华硕、HIS
XFX FX-797A-TNF上将版
XFX此次发布了两款HD 7970显卡,之前介绍的那款是非公版散热器,这款上将版则是纯公版方案。
![]() |
![]() |
![]() |
微星R7970-2PMD3GD5显卡
微星将会在明天的CES 2012会议上正式发布旗下HD 7970显卡,目前上市的R7970-2PMD3GD5也会是公版方案,不过微星还有afterburner软件助阵,现在的beta 10版本就可以支持电压调节,提高显卡的超频能力。
![]() |
![]() |
华硕HD 7970
华硕此次发布的显卡为HD 7970-3GD5,也是公版方案,不过PCB颜色换成了红色。
![]() |
![]() |
![]() |
![]() |
HIS 7970 3GB
HIS(基恩)科技发布的显卡为HIS 7970 3GB,公版方案设计。
![]() |
![]() |
![]() |
◆ HD 7970显卡图赏之镭风、昂达、铭瑄、祺祥
镭风HD 7970龙蜥
![]() |
![]() |
![]() |
![]() |
昂达HD 7970典范
![]() |
![]() |
![]() |
![]() |
铭瑄HD 7970终结者
![]() |
![]() |
![]() |
双敏无双HD 7970黄金版
![]() |
![]() |
![]() |
祺祥HD 7970显卡
![]() |
◆ 测试平台及说明
测试平台为技嘉G1刺客2 X79主板,CPU为Core i7-3960X,6核12线程,频率为3.3-3.9GHz(Turbo),原本打算超频至4.5GHz运行,不过超频之后HD 7970使用新版驱动会导致3DMark测试分数降低一半左右,最终还是恢复默认频率运行,以i7-3960X的性能来说也不会存在CPU性能瓶颈。
HD 7970使用的驱动为AMD在12月20号发布的一款新驱动,编译日期为12月19日,据称改善了显卡的游戏性能。
对比的显卡为HD 6970、GTX 580以及GTX 590,前两者是当前A/N各自的旗舰单卡,GTX 590则是双芯卡,遗憾的是找不到HD 6990,不然这五虎将汇聚LGA2011平台一定会更有看头。
测试主要分为两大部分,前面的是3D及游戏性能测试,主要对比HD 7970显卡相比目前的显卡在3D性能上进步多少。
表格中斜体的几项测试主要是考察GPU的计算性能的,以前这些东西对玩家并不重要,现在HD 7970的重点改进就在于计算性能提升,因此也加了这几个项目对比GCN架构在计算性能上的变化,这部分成绩单独计算,综合性能不算入前面的3D性能中。
◆ 双路、四路交火平台赏析
![]() |
![]() |
![]() |
![]() |
![]() |
本文的性能数据是基于单卡测试的,也在单独的文章中对比双路交火效率,由于时间关系还没来得及做三路交火,不过平台已经准备好了。
◆ Radeon HD 7970 vs.HD 6970
注:HD 6970虽然理论支持双精度运算,但是不具实用性,在OpenCLGPC测试中检测说不支持,因此没有双精度测试成绩。
长江后浪推前浪,新一代旗舰HD 7970的性能全面击败了上一代旗舰HD 6970,而且是大比分领先,具体到游戏方面来说有40%的提升,如果不是提升较少的《FarCry2》、《HAWX》这样的游戏拖后腿,HD 7970在DX11理论和游戏测试中增幅更猛,《蝙蝠侠2》中更是领先近80%。
游戏提升还只是量变,GPU通用计算性能的提升才是质变。除了在DirectCompute测试中马失前蹄之外,其他四项计算性能测试中HD 7970都是成倍甚至数倍提升,比如Sandra 2012中的密码计算,GCN架构的HD 7970相比VLIW 4架构的HD 6970提升3-5倍之多。
◆ Radeon HD 7970 vs.GeForce GTX 580
注:Sandra 2012中GP Cryptography测试中GTX 580以及下一页的GTX 590都测试不了,无论是选择OpenCL或者CUDA、DC都会报错,所以没有成绩。
旗舰单卡性能上AMD一直未能压倒NVIDIA,不过有着先发制人优势的AMD可以用新一代显卡成功翻身。除了在《H.A.W.X》这个NVIDIA传统优势游戏中略输一筹外,其他测试中HD 7970成功上位,DX9游戏领先10-15%,而在最新的DX11游戏中HD 7970普遍领先GTX 580 20-30%以上,特别是在曲面细分较多的游戏《Crysis 2》、《蝙蝠侠》优势更明显。
GPU通用性能本来是GF110架构的骄傲,不过这里也被GCN架构的HD 7970超越了,后者的优势也非常明显,无论是GP运算带宽还是实际的OpenCL测试都大比分超越GTX 580了。
◆ Radeon HD 7970 vs. GeForce GTX 590
GTX 590是双芯卡,虽然默认频率比单个GTX 580要低,但是双剑合璧的威力依然十分强大,HD 7970败北GTX 590是没有悬念的。但是,看一下具体成绩,HD 7970在多数DX11游戏中其实落后并不多,游戏性能平均也只落后20%左右,DX11游戏中差距进一步缩小到4-20%左右,这个差距其实是可以弥补的。
因为28nm工艺除了带给HD 7970更小的面积、更低的功耗之外还大幅提高了其超频能力,弥补它与GTX 590游戏性能差距的任务就要交给超频了。
◆ 超频测试:1.2GHz刚起步
早在未发布之前就有传言称HD 7970的默认频率将达到1GHz,它也是继HD 4890之后第二款默认频率过G的显卡,而真正发售时AMD还是将其频率定在925MHz,显存频率也维持在HD 6970的1375MHz水准,默认频率的降低也为超频潜力提供了更大的空间。
![]() |
![]() |
超频方式很简单,直接使用AMD Overdrive即可。驱动中给出的频率上限分别为1125、1575MHz,没有加压选项,另外需要将“电源控制”的上限拉至最高的20%,这个选项类似于CPU中的Turbo加速,不过提高的是TDP上限。对HD 7970来说,其TDP为210W,提高20%即为252W,它可以提高显卡的功耗上限,释放应有的超频的能力。
![]() |
超频中在1GHz之后本打算以25MH为步进细调,不过最终的过程却是很简单的,直接拉高到频率上限,3DMark测试也是无错通过。
![]() |
由于BIOS的限制,目前HD 7970的电压也是锁定的,overdrive以及微星的afterburner beta9软件都不能调,而且频率上限也给锁定了,非官方超频模式也解决不了,所以软超频的状态下1125/1575MHz就是目前超频的最好成绩了。
![]() |
![]() |
直接将电压加到最高1.29V,最终可以超频至1255/1600MHz,3DMark 11的P模式得分达到10030分,轻松过万。不过此时的转速需要调至50%以上,噪音明显增大了一个量级,风扇声音吵得人根本坐不住,对普通用户来说就没实用意义了,如果你对噪音的承受力更高,1255MHz也不是HD 7970的风冷极限,运气好的话1.3GHz都可能跑得到。
对超频玩家来说,冲击新的世界记录又多了一把利器,而对普通玩家来说,还是推荐默电超至1125/1575MHz,这个提升不需要在噪音上做妥协,也能大幅提升游戏性能。
◆ 温度与噪音:满载82度
温度测试采用封箱进行,机箱为火鸟(Bitfenix)入侵者,开启2个前置12cm风扇以及1个后置12cm风扇,室温在22°C左右。
测试选择了三种状态,待机(开机进入桌面温度稳定之后)、3DMark 11图形测试4负载以及Furmark 1920x1080分辨率burin-in拷机,特别是拷机测试,因为Nvidia的GTX 580以及GTX 590都有功耗保护机制,对GTX 580我们用了之前的266.58驱动破除功耗保护,不过266.58驱动不支持GTX 590,所以GTX 590的拷机温度是有保护的。
![]() |
待机温度中,除了GTX 590是41度之外其他三卡都是37-38度,表现一致,转速都在1000-1400转之间,噪音也低于机箱背景声,很安静。
在3DMark 11的循环负载中,GTX 580和GTX 590很快就达到了86度,风扇转速也在2500转以上,而HD 6970温度也升至83度,转速也有2300转左右。就噪音而言,这几款卡都能听到风扇运转声,不过声音很轻微,完全可以接受。HD 7970表现依然最好,温度最低的情况下风扇转速也是最低的。
在Furmark拷机中,GTX 590受益于功耗保护,转速降至1950RPM,温度也只有85度,当然也没明显的噪音了,严格说来这是作弊,不过总比烧了显卡要好,就不管它了。
三款单芯卡中,GTX 580由于破了功耗保护,因此在Furmark的BT折磨中温度升高到92度,风扇转速也达到3800多转,噪音非常明显。随后的则是HD 6970,温度达到了90度,转速也有2800转,略有些吵,属于可以忍受的范畴。
HD 7970的拷机温度最高也只有82度,转速在2600转上下,能听到风扇运转声。
具体的温度可以量化,噪音方面只能主观描述,简单来说:HD 7970无论是温度还是噪音都是完全可以接受的,HD 6970和有功耗保护的GTX 590属于可以忍受级别,去除功耗保护的GTX 580则是“是可忍,孰不可忍”,温度和噪音都无法让人接受。
◆ 功耗测试:ZeroCore技压群雄
功耗测试除了选择了前面温度测试的三个状态之外,还多加了两个游戏《现代战争3》和《战地3》,显卡状态也多了一个默电超频至1125/1575MHz的数据。采用功率仪记录每项测试中出现的最大功耗值,结果如下:
![]() |
第一次进入桌面之后HD 7970的待机功耗跟HD 6970基本是一样的,都在94-95W左右,本以为ZeroCore的3W待机可能会被淹没在整机功耗中,只是过了几分钟之后整机功耗就会降至83W,比HD 6970还要低11W。
不过随着负载的提高,HD 7970相比HD 6970的功耗有所增加,但是增幅并不大,轻负载中增加了10-30W的样子,Furmark拷机时差距最大有86W,不过最大功耗也只有435W。
GTX 590这样的电老虎就不用比了,只看GTX 580这样的单卡,HD 7970在性能比GTX 580更高的情况下功耗依然低于后者,而且差距多在20-50W之间,这比它的性能高过GTX 580还让人惊讶,AMD在功耗上的优势太明显了,N卡的功耗表现只能说这是NVIDIA巨核心战略的副产物,大核心虽然意味着性能强,但是它也会导致功耗飙升,这一点一直是N卡的隐痛。
此外,超频前后对比可以看到,即使是没加电压而只提高了功耗上限,但是依然导致整机功耗增大,拷机时甚至会增加60W之多,超与不超就看玩家怎么选择了。
◆ 图形的一小步,计算的一大步
随着HD 7970显卡的正式登场亮相,AMD“GCN”架构终于浮出水面,这也是自从HD 2900开始使用VLIW体系以来真正意义上的AMD显卡架构升级,承担着AMD“图形就是计算,计算就是图形”的光荣使命,而且从测试来看它真的做到了。
图形性能上,HD 7970以40%的优势领先自家的HD 6970,比NVIDIA的GTX 580也要快19%,因为DX9游戏中领先幅度普遍偏低,而在DX11游戏中,HD 7970其实要领先大约20-30%,特别是在曲面细分较多的游戏中优势更明显。
如果游戏性能的提升只算是新老架构更新必要的提升,那么计算性能上HD 7970真的像是坐了火箭一样蹿升,不论是GTX 580还是双芯的GTX 590都遮蔽不了HD 7970的锋芒,自家的HD 6970更是被远远甩在背后,HD 7970则以成倍甚至数倍的优势傲视同侪,要知道GPU计算性能可是NVIDIA的骄傲,从G80开始已经发展了三代,现在AMD只用了一代架构就轻易将对手掀翻在地。
当然,硬件上的提升还是次要的,要想在GPU计算上占据一席之地,AMD还要在编程环境、代码优化以及开发人员支持上下功夫,GCN其实也支持通用的C/C++语言、支持ECC纠错以及双精度浮点运算,但是这方面暂时还落后于CUDA。
GPU计算上的事跟普通玩家关系不大,我们这里还是继续将HD 7970看做普通的游戏显卡,那么它不仅是游戏性能最强的单卡,而且在发热、功耗以及噪音控制上表现优秀,功耗虽然高过HD 6970,但是相比前代的GTX 580依然有20-50W的优势,ZeroCore待机功耗更是难以置信地低,此外拷机温度也只有82°C,大大低于HD 6970和GTX 580。
至于噪音问题,在机箱内被背景声抵消了很多,HD 7970在拷机时能听到明显的风扇声,肯定不算安静,但是效果完全可以接受,后续如果解禁非公版显卡,配合强力的第三方散热器,HD 7970绝对有能力做到高性能的同时零噪音。
HD 7970另一个让人惊讶的地方是超频能力,虽然官方驱动限制了电压和频率上限,但是微星的afterburner软件太给力了,现在就已经支持解锁电压和频率上限,测试中轻易超频至默电1125/1575MHz、加压1255/1600MHz的水准,绝对会成为超频玩家破纪录的利器。
HD 7970的售价为4299元,这个价格比最初预定的4699元便宜了400块,性价比进一步提升了,或许4299元依然是单卡的最高记录,但是这4299元会让你得到:
最强的单卡性能
非常强大的GPU计算性能
(高兴的话可以没事跑跑蛋白质折叠什么的程序,为人类做贡献)
极好的功耗表现
(待机功耗不足3W,负载功耗比GTX 580还要低很多)
极好的超频能力
(风冷1.2GHz不过是刚起步)
至于缺点或者不好的地方,原本是想说价格过高,不过AMD自己降价了,而且离岸价也降了,成品售价还有可能再降。还想说官方对超频限制的很死,不过新版afterburner也出来了,这些不足都已经改掉或者正在修正了。
至于噪音,公版是涡轮风扇外排设计,想要散热效率就必须要有所牺牲,其实HD 7970的风扇声并不明显,个人觉得这样的旗舰级公版产品有点噪音可以接受,静音控还是等待非公版吧,现在AC已经针对HD 7970推出了新版三风扇散热器Accelero Xtreme 7970,Aqua以及EK Water blockers分别除了HD 7970适用的水冷头,只待HD 7970上市即可DIY自己需要的高性能、低功耗静音平台了。
鉴于Radeon HD 7970的出色表现,我们将之评为2012新一年的首个推荐产品。
游客 2012-10-19 12:17
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(4) | 反对(1) | 举报 | 回复
48#
游客 2012-05-29 22:44
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
47#
游客 2012-02-26 20:47
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(2) | 反对(0) | 举报 | 回复
46#
游客 2012-02-26 20:45
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
45#
游客 2012-01-20 16:12
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
44#
超能网友终极杀人王 2012-01-17 21:12 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
43#
超能网友研究生 2012-01-12 13:47 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
42#
超能网友研究生 2012-01-12 12:56 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
41#
游客 2012-01-10 19:51
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
40#
游客 2012-01-10 16:22
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
39#
游客 2012-01-10 12:08
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(2) | 举报 | 回复
38#
超能网友博士 2012-01-10 10:10 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
37#
超能网友终极杀人王 2012-01-10 09:22 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
36#
游客 2012-01-10 04:57
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
35#
游客 2012-01-10 04:44
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
34#
游客 2012-01-09 22:47
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
33#
超能网友大学生 2012-01-09 22:30 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
32#
游客 2012-01-09 22:18
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
31#
游客 2012-01-09 19:46
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(2) | 反对(1) | 举报 | 回复
30#
我匿名了 2012-01-09 18:47
该评论年代久远,荒废失修,暂不可见。
已有4次举报支持(1) | 反对(0) | 举报 | 回复
29#
超能网友学前班 2012-01-09 18:41 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
28#
超能网友终极杀人王 2012-01-09 17:48 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
27#
超能网友终极杀人王 2012-01-09 17:25 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
26#
游客 2012-01-09 17:22
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
25#
游客 2012-01-09 17:14
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
24#
超能网友初中生 2012-01-09 17:01 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
23#
游客 2012-01-09 16:51
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
22#
超能网友终极杀人王 2012-01-09 16:20 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
21#
超能网友初中生 2012-01-09 16:06 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
20#
游客 2012-01-09 16:06
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
19#
加载更多评论