E X P
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 全文浏览

    [技术] nVIDIA SLI技术解析

      SLI技术是实现了两款显卡同时出现在一块主板上,构成一套SLI双显卡并行系统,这一技术的应用更大程度的满足了用户对高品质画质的需求。

    SLI桥接器。

    通过SLI桥接器连接的两片GeForce 7950 GX2显卡。

      如图所示,我们可以看到,nVIDIA的SLI互连不再是和Voodoo2一样借助线缆,而是使用一块两端有“MIO”接口的PCB连接子卡。卡上的接口有点儿类似PCI Express×1,而在显卡的顶部位置则预留了对应的接口。这样,该SLI连接卡就可以将两块nVIDIA显卡连接起来,实现SLI并行运作。nVIDIA官方表示,选择PCB卡连接可充分保证信号通讯的质量与速度,显卡间的数据传输采用数字形式进行,这样可有效防止因信号干扰而导致画面不同步的弊端(nVIDIA已经公布了可用驱动支持nVIDIA GeForce 6600标准版组建SLI系统,而这种新型的SLi系统无需通过连接卡便能实现)。Voodoo2所采用的技术是模拟传输方式,数字信号先被转换为模拟信号后才进行合成,因为干扰的影响,在某些时候会出现数据不匹配的问题,导致合成后的画面往往难以同步或出现其他问题,这也是Voodoo2 SLI技术的主要缺陷。而改用数字信号传输,显然就不存在这个问题,显卡处理完的帧数据被集合起来合成,然后才转为模拟信号输出,从而确保画面的完整性。


    NV40核心内的SLI功能控制逻辑

      nVIDIA将SLI控制功能直接的集成到在显卡的GPU芯片内部,从上图的芯片的逻辑图中可以很容易的看到,在显示核心的左侧左侧偏下的位置有一个很小的区域专门负责SLI运作,该区域所掌管的职能包括两块显卡的连接、通讯,渲染任务的指派以及画面的合成等等。由于指令的传输工作相对简单,在芯片的FCBGA封装中也只有极少几根针脚用于SLI模式。但由于别的GPU并没有集成这一控制逻辑,所以别的显卡并不支持这一技术,但由于特殊的原理的所以SLI技术并不支持AGP总线,SLI技术只可运行在PCI-E模式下,对主板提出了新的要求。不过最令人称奇的还是它的并行能力,nVIDIA的研发专家声称,SLI技术最多可以支持8块GPU并行运作,虽然在消费市场没有什么意义,但在工作站领域,8块GPU并行意味着可获得超高的渲染效率。

      以上介绍的只是SLI最表象的特征,真正的关键在于这套系统的运作机制。SLI的两款显卡地位并不是对等的,一块显卡作为主卡(Master),另一块则作为副卡(Slave)。其中主卡负责任务指派、渲染、后期合成、输出等运算和控制工作,而副卡只是接收来自主卡的任务进行相关处理,然后将结果传送回主卡。这里,我们需要明确数据传送的两个途径。两块显卡都是通过PCI Express接口与主板连接,而这两块卡之间还有一个通讯的PCB卡。其中,连接两块显卡的PCB卡用于任务指派指令以及后期处理结果的传送,这部分的数据量不会很大,所以PCB卡所使用的接口和自身结构都较为简单。但是,显卡在渲染过程中必须调用大量的数据,这部分数据只能通过PCI Express接口从系统中获取。换言之,在SLI系统中有两部分不同的数据流向,一部分为主卡将任务指令通过PCB连接卡传送给副卡,副卡将渲染完毕的结果数据返回给主卡合成,另一部分为处理过程中从PCI Express接口得到的原始数据。


    Voodoo2的传统奇偶分工方式

      Voodoo2的SLI技术采用帧线方式划分任务:一幅渲染的画面被分成奇数渲染帧和偶数渲染帧两个部分,然后交给两块显卡分别渲染,完毕之后再统一合成。虽然nVIDIA继续沿用了“Scalable Link Interface”的名号,但工作的方式已经有本质性的不同。在nVIDIA的SLI系统中,一幅渲染的画面被划分为上下两个部分,主显卡完成上部分画面,副显卡则完成下半部分的画面,然后副显卡将渲染完毕的画面传输给主显卡,主显卡再将它与自己渲染的上半部分画面合成为一幅完整的画面。这样,一个完整的SLI并行渲染任务就完成了。同理,倘若有四块GPU并行运作,那么画面会被分成四个部分分别渲染,8个GPU并行也是如此。


    nVIDIA SLI的智能分工方式

      传统的多GPU技术多半采用任务均分的方式,两块显卡完成的渲染任务量完全均等,Voodoo2的SLI及之后的Voodoo 5系列都是如此,ATi的MAXX显卡和XGI的Volari Duo系列产品也是采纳类似的思想。但这种任务均等分派的设计并不科学:首先,主显卡或主GPU必须承担额外的控制、任务分配、画面合成和输出等工作,用于渲染的运算资源较少,但它必须完成与副卡一样多的任务。结果自然是,副卡率先将任务完成,把结果数据回传后便处于等待状态,直到主卡将本批次任务处理完毕之后才可以继续进行任务指派;第二,同一幅画面不同区域的复杂度并不相同,所需的运算量也不一样,如果使用Voodoo2的帧线划分方式那也没什么,但nVIDIA的SLI采用划分上下画面的方式,如在常见的赛车游戏中,画面上半部分几乎是静态的,而下半部分就非常复杂,需要处理的数据量很大,如果单纯将画面作均等的划分也不科学。

      为此,nVIDIA另行开发了一套动态负载平衡技术,画面的上下划分并不是按照固定的一半一半方式,而是根据画面的复杂情况进行划分,如可能为4:5或3:2等非均等的模式。这样的分配并不是为了保证工作量在两块卡间的绝对平均分配,而是要将两块显卡完成渲染任务的时间保持一致,以此达到效能的最优化。考虑到主显卡需要承担额外的控制任务,用于实际渲染运算的资源较少,动态负载平衡算法就可以根据这一前提,将任务量适当多给副卡分担。这样,nVIDIA所构建的SLI系统就可以保证两块显卡都工作在最佳效率条件下。要提到的是,这项动态负载平衡算法并不是集成在GPU芯片内部,而是在驱动程序中整合,nVIDIA可以方便对其进行修改,以提供更佳的性能。

      以下是这种动态负载平衡技术进行均衡的多种渲染的过程:


    1.待渲染的画面被分成上下两部份


    2.渲染完毕后统一交给主卡进行合成


    3.主卡将合成后的画面输出到显示器

      但是,这种动态平衡技术并非万能的,nVIDIA SLI的无法支持在不同的显卡间构建并行系统,而两块显卡协同工作时上下两部分画面的V-Sync(垂直同步)也是一个问题,如果打开该功能势必会对游戏性能产生一定的影响,不过nVIDIA表示已采用缓存技术来解决这个问题,另外建立SLI工作模式后的两块显卡也都支持超频,但必须使两块显卡的频率完全保持一致。

      nVIDIA在推出SLI技术时就受到了人们的关注,客观上地说,Multi-GPU的确是一项可以切实提升图形显示性能的技术,它通过双卡并联输出,其理论图形性能可得到将近一倍的提升,游戏爱好者可以充分体验到这种速度提升快感,而对于专业设计人员来说,SLI也将带来效率的翻倍也使得渲染工作的时间几乎可缩短一半。

      通过这种先进的SLI技术我们可以得到几乎翻倍的图形显示性能,把它引入实际应用也不再不切实际了,它不再像以前组建Voodoo2 SLI那样昂贵,普通消费者也可以轻易体现到这种先进的技术,这一方面是因为受到ATi Crossfire带来的压力,而对于长远来说,nVIDIA可以在负载平衡算法以及核心开发上下功夫,这种SLI技术和市场定位也要不断演变,让更多的消费者都能轻易组建自己的SLI系统,例如使新旧显卡一起工作在SLI模式下,用户升级时不用抛弃旧显卡而只需购买一张更快的显卡来构建SLI系统。SLI的发展前景是光明的,要是能使SLI普及化,将会对整个显卡市场产生深远的影响。

      不过,在nVIDIA刚推出这种双卡并联技术时,作为普通消费者的我们是可望不可及的,因为早期支持开启SLI模式只有Geforce 6800等高端显卡,另外支持SLI亦要使用唯一的nForce4 SLI芯片组平台,整套配置成本上是相当昂贵的。因为高姿态的SLI技术对于一般应用实在是不切实际,所以在SLI面世一年后,来自各方面的压力,NV终于走下神台,通过更新驱动,SLI双卡模式在中低端的显卡产品上都能实现,SLI从此普及起来。

      在SLI推出初期,硬件上实现SLI其实并不是问题,但是对于当时来说,对应支持双卡加强输出的大型图形处理软件和游戏等都屈指可数,软件未能普及支持SLI技术也是阻碍SLI前进的一大关键因素,直到进入2005年下半年,业界才逐渐推出针对SLI优化的程序和游戏,如经典的3DMark06、Quake4、F.E.A.R等都是可对应SLI加速的软体和游戏,而到如今2007年,支持SLI技术的软体不断增多,SLI也越来越普及了。

    ×
    热门文章
    1OpenWrt首款硬件产品已有实物,且将会在OpenWrt峰会展出并被拍卖
    2Epic平台免费领取《诈欺娇娃》和《塞勒姆镇2》, 至4月25日23点截止
    3Thermaltake钢影透EX机箱开售:支持360水冷,10风扇位,299元
    4IGN对横尾太郎与金亨泰进行访谈,横尾太郎表示日本厂商不习惯使用西方技术
    5Win11 AI资源管理器或只支持骁龙X Elite,Intel和AMD处理器可能无法启用
    6消息称一加 Ace 3 Pro将采用全新的家族式外观设计,且定位不低
    7优派VX2758-2K-PRO显示器上市:2K@185Hz满血小金刚,首发849元
    8更多Xeon 6的信息曝光:Granite Rapids与Sierra Forest最大TDP均达500W
    92024Q1中国显示器市场报告出炉:AOC排名第一,整体均价下行
    已有 2 条评论,共 2 人参与。
    登录快速注册 后发表评论
    • 游客  2016-03-04 17:46

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • 游客  2015-11-29 02:28

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明