E X P
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    ◆ 前言

      去年10月底,NVIDIA推出了G92核心的GeForce 8800GT,采用65nm工艺制造,8800GT推出后,取得了巨大的成功,12月,NVIDIA再接再厉,决定让G92图形核心以128个流处理器的完整形态出现,同时提高频率,最终这款产品被命名为“GeForce 8800GTS 512”,继续保持在显卡市场的领导地位。到了2008年,NVIDIA的产品全面转向9系列,因此GeForce 8800GTS 512的更高频版本加上支持3-way SLI的GeForce 9800 GTX应势而生。

      NVIDIA GeForce 9800 GTX可以简单地理解为8800GTS 512MB超频后的3-way SLI版,但这个世界却变化得很快,随着对手AMD在今年6月发布Radeon HD 4800系列,中端显卡市场格局从NVIDIA一家独大变得颇为微妙。7月,GeForce 9800 GTX+受命登场,作为这个天平上的一个重要砝码,它的意义比起9800 GTX来说重要得多。

      GeForce 9800GTX+的光荣使命是歼击ATI Radeon HD 4850,两者在价格上接近的,然而除了图形计算能力外,9800GTX+的另一张王牌是它强大的并行计算能力和物理加速能力。

    ◆ 9800GTX+:NVIDIA首款55nm产品

    Inno3D GeForce 9800GTX+游戏战斗版

      GeForce 9800 GTX+作为9800 GTX的加强版,基本架构以及外观是一致的,还是基于G92架构的,同样是128个SP,16个ROPs,256bit位宽的GDDR3,但9800 GTX+的频率要更高,核心频率从675MHz提升到了738MHz,相应的Shader频率也从1688MHz提升到了1836MHz,不过显存频率还是保持在1100MHz(数据传输频率为2200MHz)。

      从9800 GTX+开始,NVIDIA显卡开始转向55nm生产工艺,更先进的制造工艺有利于降低成本、控制功耗和提高频率,它所带来的好处是显而易见的。采用55nm的9800 GTX+其核心代号为G92-400-B1,65nm版本的9800 GTX核心代号为G9-400-A2,早期有少量的9800 GTX+还是使用的65nm工艺,包括9800GT也有同样情况,要注意区分。

      直观上来看,55nm下的核心更小,核心面积从18*18mm减少到了17*17mm,只有原来的90%不到,却封装了相同多的晶体管(7.54亿个)。功耗上的表现也有目可睹,频率上9800 GTX+要高不少,不过凭借更精致的制造工艺,整卡功耗也仅141W,和9800GTX的140W几乎没有变化,更具体的数据可以留意后面的功耗测试部分。

    NVIDIA GeForce 9800 GTX+详细规格表

     

    ◆ Inno3D 9800 GTX+游戏战斗版欣赏

      Inno3D映众作为NVIDIA核心AIC厂商,旗下产品线相当丰富,此款9800GTX+游戏战斗版显卡主打千元级市场,参考价为999元,卖点相当丰富,首先它支持PhysX物理加速,具备CUDA并行架构、支持未来的3D Stereo技术,并且频率规格、做工以及散热方面都相当有特色。

     

    P391 PCB设计体现强大的研发实力

      Inno3D映众9800 GTX+游戏战斗版在显卡设计上,依靠强大的一手资料及强大的研发团队,研发出单6Pin电源接口公版号P391版本PCB(公版为P392),其能吸收nVIDIA的设计精华并通过种种后期微调最大程度的发挥芯片的实力。GPU采用最新的55nm工艺制造,其核心频率为738MHz,显存频率为1100MHz,与公版频率一致。

    背面

    双DVI + S-Video输出接口

    热管散热器,超频三代工

      Inno3D映众9800 GTX+游戏战斗版的散热器由超频三代工,所以可以看到很多熟悉的特色,如DHT直触式热管技术、插齿工艺等。三根热管能直接将热管从GPU转移到散热鳍片上去,热传递效率非常高。整个散热器比起公版散热器来要轻很多,天长日久长期使用基本不会引起显卡变形。同时向下吹风设计对显存也有辅助散热的作用。

    Inno3D映众9800 GTX+游戏战斗版裸照

       看到的此款显卡采用了加长的PCB板型设计,在布局上非常从容,显卡的供电模块全部集中在PCB末端、可以最大程度减少元器件电流对于核心以及显存工作的电磁干扰,豪华供电足八层PCB板上大面积使用高品质的三洋OSCON贴片电容,并配最高品质陶瓷电感。

    单6Pin的电源接口设计

    0.8ns的HYNIX显存

      这块显卡使用了8颗HYNIX 0.8ns的GDDR3显存,规格为16M*32bit,单颗容量为64MB,一共组成512MB的容量。0.8ns的理论工作频率为1250MHz,而9800GTX+显存的额定频率为1100MHz,因此还有一定的超频空间。

     

    ◆ 不只是一片显卡,它是Graphics Plus

    GeForce的新Logo

      CUDA是NVIDIA的一个重要战略方向,倡导显卡在开发中遵循"Beyond Gaming"和"Gaming Beyond"两个原则,Beyond Gaming指GPU面临的工作不但有游戏,还包括了针对普通用户和专家的非游戏密集运算型程序;Gaming Beyond指显卡能够发挥出惊人的画面效果,带来完全真实的画面体验,同时带来准确的物理特效。,NVIDIA称“只是一片显卡是不够的”。

      从这个意义上来说,9800GTX+不再只是一块娱乐级的显卡,开始注重非游戏的密集型计算任务,它具有强大的并行计算能力是NVIDIA倡导的GPU Computing坚实的基础。

      为了进一步强化CUDA的作用,目前在支持CUDA的GeForce显卡上都更新采用了有“GeForce WITH CUDA”字样的新Logo。不仅仅如此,NVIDIA还将CUDA功能重新包装,方便让更多的消费者认识,毕竟CUDA(Compute Unified Device Architecture,统一计算设备架构)这个词对于大多数人来说还是显得相当的深奥和专业,重新包装后的新概念就是——Graphics Plus。

      NVIDIA称,具备CUDA功能的GeForce就是“Graphics Plus”。Graphics Plus单从字面上理解确实要比CUDA有亲和力得多,NVIDIA给它的中文解释为“超越图形世界”,实际上都是给CUDA一个更简单更直观的说明。

    Graphics Plus

      在早前NVIDIA曾有过“THE FORCE WIHTIN”的宣传,将PhysX、CUDA、3D Stereo和SLI打包统称为四大内功,因此有了流行一时的“GeForce内功,威力无穷”。而现在的“Graphics Plus”更加突出CUDA的作用,将3D图形处理之外的应用如“Physx物理加速、视频处理加速、图形处理加速和3D Stereo”都是“Graphics Plus”的重要组成部分,前三者都是基于CUDA功能的应用。

      GPU具有亿万次的计算能力,CUDA能让这种能力得以释放。新的Logo和“Graphics Plus”概念,一下将CUDA与我们的距离拉得更近。对于GeForce 9800 GTX+来说,它是推广CUDA应用的先行尖兵。

     

    CUDA实战:Folding@Home

      Folding@home是美国史丹佛大学推动的分散式运算计划,目的在于使用联网式的计算方式和大量的分布式计算能力来模拟蛋白质折叠的过程,并指引对由折叠引起的疾病的一系列研究。NVIDIA表示,目前全球有7000万块CUDA显卡(GeForce 8及以上及Quadro和Tesla系列),平均拥有100GFLOPS的浮点运算能力,如果这其中有0.1%参与Folding@Home,就能够为该计划带来7PFLOPS的运算能力,远远高于全世界最强大的超级计算机(运算能力不足1PFLOPS)。

      

      通过FahMon监控软件,9800GTX+的PPD(每日得分率)分数为5529,而Radeon HD 4850的PPD分数在3700左右,相去甚远。

      RV770的160个4+1流处理器结构的US在F@H中不可能有天然化的4D给它消化,关联数据无法进入US内部外带能靠VLIW打包同进同出的数据极为稀有,绝大多数情况下RV770只能使用US单元中唯一的一个全功能SP进行运算,因此RV770在通用计算上的羸弱也在意料之中。

    CUDA实战:视频转换

      利用CUDA实现GPU计算来为应用程序提速,Badaboom就是很好的一例,这是一款CUDA开发的视频转换软件,可以把mpeg2的视频转换为ipod或者iphone这样的所使用的H.264视频格式。

      我们使用TMPGEnc和Badaboom将同样一段时长约为25分钟左右的MPEG-2编码的1080i视频编码转成MPEG-4格式,分辨率降低为480x270。

      使用Badaboom,通过CUDA接口利用9800GTX+的GPU计算能力进行编码转换,可以看到转换时FPS高达115.4,几乎是实时速度(30FPS)的4倍,在视频压制完成之后,总用时长为5分50秒。

      作为对比,我们采用了一款千元级别的CPU E6850利用TMPGEnc软件来进行视频转换,从实际工作情况来看,CPU占用率非常高,达到90%左右,这是由于软件只采用CPU进行视频压制的原因。由于性能限制,不能进行实时压制。压制完毕之后,总时长也达到了35分23秒,比采用CUDA的Badaboom压制时间多了6倍!

      Badaboom让我们最真实体验到了CUDA在日常应用程序中的强大能力,相信这样的应用也会越来越多。日前Badaboom发布1.1版本,价格为29.99美元,你可以先下载一个试用版玩玩,前提你必须有一块支持CUDA的NVIDIA GeForce 8系列以上的显卡。

    ◆ 9800GTX+支持PhysX物理加速

      今年2月NVIDIA收购了物理加速处理器厂商Ageia,将这一颇有前途的技术收归囊中,显然PhysX物理加速技术自然会逐渐融入到NVIDIA的产品中,NVIDIA在其后称他们正在努力将物理引擎移植到CUDA架构中,而如今NVIDIA已实现了它的诺言,9800GTX+是首批支持物理加速能力的显卡之一。

      PhysX设计用途是利用具备数百个内核的强大图形处理器来进行硬件加速,加上GPU超强的并行处理能力,PhysX将使物理加速处理能力呈指数倍增长并将你的游戏体验提升至一个全新的水平,在游戏中呈现丰富多彩、身临其境的物理学游戏环境。其中特色如下:

      ·爆炸引起的烟尘和随之产生的碎片
      ·复杂、连贯的几何学计算使人物的动作和互动更加逼真
      ·其视觉效果令人叹为观止的全新武器
      ·布纹的编织和撕裂效果非常自然
      ·运动物体周围烟雾翻腾

    通过驱动,PhysX能够利用PPU,CPU以及CUDA进行物理模拟

    PhysX驱动

      对于游戏玩家来说,NVIDIA PhysX当然是用来加速PhysX引擎游戏的物理效果了。和其他物理引擎相比,引擎的优点在于采用硬件加速,能够为游戏提供其他物理引擎所不能比拟的大规模物理运算。在其他物理引擎在不大量降低机器性能的情况下完成对人物肢体,数量不多的物体之间的物理动作演算的时候,PhysX已经能够利用GeForce硬件的运算能力为我们呈现出逼真的液体流动,软体动物的软组织运动,先进的碰撞检测,采用连贯的几何学让人物动作互动更加真实。

    借助PhysX的强大性能,游戏制作者可以将整个场景都设计成可被破坏,而不必担心CPU先天不足的并行计算能力了。

      稍微有些遗憾的是,这一切都需要游戏或者软件首先选用PhysX物理引擎,才能获得PhysX的硬件加速能力,目前已有超过150款的游戏支持PhysX,并有更多的支持PhysX的游戏即将出台,软件注册用户数量已超过10,000名。索尼的Playstation 3、微软的Xbox 360、任天堂的Wii以及个人计算机均支持PhysX。NVIDIA已经在全力推广这一先进的物理引擎,相信在不久的将来能够有更多游戏选择这一高效,真实的物理引擎。PhysX软件被广泛应用于150多个游戏中,

     

    ◆ PhysX实战:3DMark Vantage

    CPU Test2,此图未开启显卡物理加速功能

      3DMark Vantage下的CPU Test2是用来测试显卡物理运算能力的,测试场景是一个飞行竞赛,不过却加入了很多危险的障碍。飞机尾部将会喷出烟雾,而烟雾会和景内的软体物件如充气的障碍,以及旗帜等东西相互干扰,同时也会自行扩散,会被经过的飞机所影响,产生有趣的物理运动效果。

    CPU Test2,此图已开启显卡物理加速功能,障碍物增多

      使用9800GTX+显卡,并开启物理加速的话,那么它将会增加出更多的障碍物。

      在3DMark Vantage中开启与关闭FPU功能,对总成绩影响很大,可以看到在Performance模式下,开启PhysX加速后,9800GTX+的总分达到8214,如果关闭PhysX加速,则只有7605,开启PhysX加速除了有更好的视觉体验外,中间还有超过8%的性能的提升,而这一切都是免费的。

     

    ◆ PhysX实战:Cryostasis

      NVIDIA自然不会满足于PhysX只在3DMark Vantage中的演示,让更多的游戏支持PhysX才是最实在的。最新展示的Cryostasis Techdemo中,它首次运用了光滑粒子动力学原理(Smoothed Particle Hydrodynamics,SPH),利用GPU来进行流体模拟计算。与传统的只能计算碰撞的粒子系统不同,SPH还能计算出流体的粘性和排斥力,高度模拟出粒子飞溅的仿真效果。PhysX的特性还体现在油布、窗帘、布娃娃和刚体上,模拟布料和热效应。

      为了达到逼真的流动效果,必须要模拟成千上万的液态微粒,仅仅是DEMO的第一间房就包含了将近3万个流体微粒,它们与周围环境和其他微粒相互作用着。Cryostasis中的液态模拟是由PhysX引擎、NVIDIA的CUDA技术和GPU的并行处理能力共同实现的。

    水花落在人物身上,会呈现出逼真的飞溅效果

    PhysX模拟出浮力的效果,因此桶是在水面上漂浮的

      Cryostasis中的流体模拟是由PhysX引擎、NVIDIA的CUDA技术和GPU的并行处理能力共同实现的,因此要想流畅地进行游戏,一块支持PhysX物理加速的显卡是必不可少的。像Radeon HD 4850即使是在1024*768这样分辨下也只有10FPS左右的速度,通过CPU去做物理计算使得整个系统不堪重负。一旦显卡支持GPU物理计算,立即有了翻天覆地的变化。GeForce 9800GTX+在1680*1050 high模式下平均帧数也在27左右,在1280*1024分辨率下平均帧数超过33FPS,具备较好的可玩条件。

     

     

    ◆ Inno3D 9800GTX+的温度表现

      前面说过,Inno3D 9800GTX+游戏战斗版的散热器选用了超频三代式的三热管直触式散热器,实际上散热效果会如何呢?

    Inno3D 9800GTX+游戏战斗版的散热系统

    满载时GPU的最高温度为56℃(频率738/1836/1100MHz,点击放大)

      在自动风扇控制模式下,运行FurMark稳定性测试后GPU温度最高只有56℃,而公版9800GTX+的温度通常在65℃以上,可见Inno3D的这块显卡在散热上的表现不错,在自动风扇转速下,风扇的噪音也是可能接受的。

      形成强烈对比的是公版Radeon HD 4850,其在散热上的表现只能用“烂”来形容,已被口诛笔伐得体无完肤,看过我们早前的测试就知道,运行FurMark满载时的温度达到92℃,待机时更是有79℃之高。

     

    ◆ 性能测试平台及说明

      进行测试的驱动都是目前最新的驱动程序,NVIDIA GeForce显卡使用的是Forceware 180.48 WHQL驱动,ATI Radeon HD 4850使用了催化剂8.12 Hotfix版本。

      具体的游戏设置,开启了所有可以打开的特效,另外AA和AF均由游戏内建的情况决定,我们不使用驱动面板进行强制性驱动,对于没有内建benchmark的游戏,采用Fraps来测试。

     

    ◆ 完胜:GeForce 9800GTX+ vs Radeon HD 4850

    ◆ 9800GTX+:优秀的中端显卡

      55nm的GeForce 9800GTX+无愧于加强版,伴随着频率的提升和驱动的改进,性能上有不少进步,在与Radeon HD 4850的对抗中,具有10%的完胜优势。而且同样制程的Radeon HD 4850的致命伤在于它的散热,这方面上GeForce 9800GTX+更是占据着绝对的优势。

      NVIDIA更注意超越图形世界之外的内容,也就是它的“Graphics Plus”理念,将“Physx物理加速、视频处理加速、图形处理加速和3D Stereo”整合在一起,更加突出CUDA的作用。具体到GeForce 9800GTX+这一产品上,正如前言所述,它的使命就是歼击Radeon HD 4850,在3D性能上已分高下,它在PhysX和CUDA上的优势更彻底把Radeon HD 4850远远抛开。

      随着GeForce 9800 GTX+价格的一再下降,像Inno3D的游戏战斗版目前报价为999元,与大多数Radeon HD 4850持平,这样Radeon HD 4850的价格优势几乎丧失殆尽,抛开感情色彩而言,实在是没有理由在去选择Radeon HD 4850。

      Inno3D GeForce 9800GTX+游戏战斗版具有良好的散热能力,单6Pin电源接口设计,做工用料都属上乘,值得将之收入囊中,在这个春节呼朋唤友纵情驰骋游戏之中。

    ×
    热门文章
    1Argon ONE V3是一个精致的树莓派机箱,不仅统一IO接口方向还提供主动散热
    2PCIe 6.0/7.0规范推进放缓,新技术的采用或面临延迟
    3微软多款游戏在PS store上持续畅销,《盗贼之海》荣登5月下载榜榜首
    4英特尔Arc显卡31.0.101.5590 WHQL驱动:对《艾尔登法环》首个DLC优化
    欢迎参与评论,每一条合规评论都是对我们的褒奖。
    登录快速注册 后发表评论
    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明