E X P
正努力加载中…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 全文浏览

    ◆ VLIW 5、VLIW 4再到non-VLIW的进化

      有关AMD以及NVIDIA的GPU架构的讨论文章有过很多,以致于架构设计的不同也成为双方以及双方大军互相攻讦之处,技术上的细节先不去管他(包括笔者在内的大部分人也不懂这么多),我们只需要知道NVIDIA自从DX10统一渲染架构改走是1D标量、MIMD(多指令多数据)体系,而AMD从HD 2900开始的R600架构开始就是不断改良原先的4D矢量、SIMD(单指令多数据)体系。

    VLIW 5:AMD图形架构的根基

      即便流处理器单元数量翻了几番,目前AMD显卡的微观架构还是没有什么太大变化的。DX9及之前的显卡渲染要分为顶点渲染(vertex shader)和像素渲染(pixel shader),分别计算像素的位置参数XYZW以及色彩参数RGBA,正好都是4次运算,这就是图形计算的4D矢量运算,在DX10以前双方显卡比拼的就是vs单元和ps单元的数量,或许还有人记得评价显卡运算能力的一个重要参数---三角形生成能力。

      到了DX10时代,微软的DX API取消了顶点渲染器和像素渲染器之分,改成统一处理器(Unitied Processor),图形渲染中标量运算越来越多,单纯的矢量运算分成在减少,为此NVIDIA推倒重来设计了G80这样的1D标量处理器,而AMD并未完全放弃4D矢量架构,而是在此基础上做了一些改良,增加了一个标量运算单元,AMD称之为Superscalar超标量单元,形成了4D+1D的矢量标量混合架构,这便是VLIW 5架构的由来。

    AMD显卡的主流架构依然是VLIW 5体系

      所谓VLIW是Very Long Instruction Word(超长指令口令)的简称,它可以把需要的计算指令组合成适合4D+1D架构的长指令,这样理论上每个统一处理器秒周期可以执行5次计算,而这5个运算单元(ALU)只需要一个发射端口,电路设计简单多了,功耗和发热也容易控制,缺点就是依赖指令组合,一旦非最优指令组合,运算效率就低多了。

    VLIW 5架构由4个矢量单元外加1个标量单元组成,运算需要适当的指令组合

    VLIW 4:HD 6900首次改变

      虽说VLIW 5架构电路相对简单,增加数量也容易些,但是受限于工艺和晶体管规模,从HD 5870的1600个流处理器单元继续增加一倍进而生产下一代显卡也不可能了,而且流处理器数量越多,效率问题愈发严重,AMD必须要改革了。

      在HD 6900系列显卡架构上,AMD就改进了VLIW 5架构,去掉了4D+1D中的1D单元,VLIW 5变成了VLIW 4,所以显卡的流处理器单元数量也不再是是5的整数倍,而是4的整数倍了。

    HD 6900系列显卡上开始使用VLIW 4架构,每个ALU单元的功能有所增强

      准确来说,VLIW 4架构中的4个ALU单元不是前面所说的那个4D单元,而是4个1D单元,功能更强了,都可以执行原本只有VLIW 5架构的那个1D超标量单元才能执行的特殊函数操作,所以流处理器单元数量虽然少了,实际上性能更强了。

      据AMD称,VLIW 5架构的运算效率实际只有70%左右,VLIW 4可以提高到80%,同样的核心面积下能带来10%的性能提升,简化了指令调度和寄存器管理,提升了逻辑电路利用率。

      VLIW 4只是VLIW 5架构的一小步改变,但是代价也是高昂的,5到4的减少意味着每组流处理器所需的发射端、分支预测以及寄存器单元都要增加四分之一,以HD 6970为例,其晶体管数量以及核心面积从HD 5870的21.5亿/334平方毫米增加到26.4亿/389平方毫米,而TDP功耗也从188W增加到250W,成本和售价升高了。

      VLIW 4架构只在三款HD 6900显卡上使用,并没有推广到中低端市场来,这主要是市场竞争因素所致,因为AMD的显卡在功耗和发热上同比NVIDIA的Fermi家族显卡还是要好一些,性能、价格则是各有所长,AMD并不需要急着推新架构显卡,HD 5770换个名字照样卖的很好。

      VLIW 4架构未能普及,但是它注定要成为过渡架构了,因为使用AMD下一代显卡架构Graphic Core Next(简称GCN)的显卡即将上市了,相比VLIW 5/4只有70-80%的效率,GCN抛弃了VLIW体系,运算效率接近100%,走的也是MIMD体系了。

    ×
    热门文章
    1酷冷至尊魔方NR200P ITX机箱评测:玲珑剔透,其容也大
    2新版《微软模拟飞行》将于8月18日正式发售
    3Tiger Lake-U的核显将拥有新的名字:Intel Iris Xe Graphics
    4华为公布2020年上半年经营业绩:销售收入4540亿元,消费者业务收入2558亿元
    5由于苹果没有订购足量屏幕,三星已获得苹果约9.5亿美元“补贴”
    6你的人脸信息或许就值5毛一份,淘宝、咸鱼有售
    73款新iPhone的电池信息被发现, 5.4寸版新iPhone可能仅有2227mAh的电池
    8曾经受“降频门”影响的iPhone用户,现在可以到苹果处领25美元赔偿金了
    9Google上架了Pixel 4A手机,但暂时称它是个“Wi-Fi”
    已有 23 条评论,每一条合规评论都是对我们的褒奖。
    • 游客 2019-01-24 12:10

      В условиях нестабильной экономики, в то время, когда заработная плата и пенсионно ...

      支持(2)  |   反对(1)  |   举报  |   回复

      23#

    • 游客 2017-06-11 14:31

      游客

      该评论因举报过多,自动进入审核状态。

      不要使用2B一类的侮辱性词汇 你可以说慢 效率低 但请你尊重别人五年多以前的劳动成果

      已有2次举报

      支持(7)  |   反对(0)  |   举报  |   回复

      22#

    • 游客 2017-06-05 09:51

      该评论因举报过多,自动进入审核状态。

      21#

    • 游客 2012-11-26 07:41

      每四个CU共享的16KB标量缓存应该是只读的

      已有2次举报

      支持(0)  |   反对(17)  |   举报  |   回复

      20#

    • 游客 2012-11-26 02:46

      好文章,很专业也比较全面。 再有一个小问题,AMD官网上写的是Graphics Core Next,有个s的,嘿嘿。

      已有2次举报

      支持(1)  |   反对(3)  |   举报  |   回复

      19#

    • luningdq终极杀人王 2012-01-09 00:21  加入黑名单

      这次文章真给力,不但大开了眼界学习到知识还能得奖,OH my超能,铁杆儿支持啊

      已有3次举报

      支持(0)  |   反对(3)  |   举报  |   回复

      18#

    • bolvar终极杀人王 2011-12-30 13:49  加入黑名单

      网友 [npolor] 的原贴:1楼
      Gprahic这个单词打错了,在介绍GCN简称的时候
      抱歉,现在才看到这个评论,已经更正了。

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      17#

    • 游客 2011-12-29 11:28

      2x%的提升,算是不错了

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      16#

    • 游客 2011-12-29 11:28

      网友 [thesea] 的原贴:1楼
      在通用计算方面,NV似乎领先了两年
      至少在ECC C++这些方面,确实领先了两年

      已有3次举报

      支持(0)  |   反对(16)  |   举报  |   回复

      15#

    • npolor学前班 2011-12-29 09:31  加入黑名单

      Gprahic这个单词打错了,在介绍GCN简称的时候

      已有1次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      14#

    • coffeeshop高中生 2011-12-29 06:26  加入黑名单

      没拿到卡也犯不着每篇文都要吐炒,有失专业性. Chiphell不是拿到了7970了. 说实话,现在很少来这里,总是拥着N卡,纸上专业分析之后不忘有失实事求事技术本位说些乱七八糟的,连卡都没拿到就能开始唱衰AMD不敢苟同. 可说已经沦为INTEL, NVIDIA的枪站了. 痛心一个沉沦的网站.

      已有2次举报

      支持(9)  |   反对(5)  |   举报  |   回复

      13#

    • 游客 2011-12-25 12:38

      【最后吐槽一下,】支持吐槽!

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      12#

    • 游客 2011-12-24 23:40

      老外那儿有评测你翻译过来不久行了么 等你妹啊

      已有2次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      11#

    • 游客 2011-12-24 19:37

      新代GCN架构确实够强,期待主流级别显卡面市

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      10#

    • 游客 2011-12-24 01:54

      太专业,看不懂啊

      已有2次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      9#

    • 游客 2011-12-24 01:54

      原文由网友 [Guest] 于2011-12-23 21:23:29发表 看过下外网的结论,普遍认为这代游戏,以目前的技术画面已经到顶了(真实级数还远着呢。。。),除非光线追踪这些真的 
      杯具啊

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      8#

    • 游客 2011-12-23 21:23

      看过下外网的结论,普遍认为这代游戏,以目前的技术画面已经到顶了(真实级数还远着呢。。。),除非光线追踪这些真的得到应用,但短期内这仍很难在个人级的硬件上实现。 所以未来一段时期内,显卡会主要向通用计算方向发展(提高运算性能,也是7900设计要做的),至于游戏画面这些的提升相对则会较慢。

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • 游客 2011-12-23 10:03

      不错,这次AMD的改动还是很大的,好象性能也很NB,国外测试7970比580要快20%

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      6#

    • 游客 2011-12-22 18:05

      Tom's hardware 谈论一些改进 用了容易理解的图形.

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 游客 2011-12-22 16:43

      饿,等产品出来了再说吧,悲剧的AMD,终于醒了,不过两年了···

      已有2次举报

      支持(1)  |   反对(1)  |   举报  |   回复

      4#

    • thesea管理员 2011-12-22 16:39  加入黑名单

      在通用计算方面,NV似乎领先了两年

      已有2次举报

      支持(0)  |   反对(15)  |   举报  |   回复

      3#

    • h7838354研究生 2011-12-22 16:26  加入黑名单

      AMD还是专心做显卡好了!~~~~~~~~~~~~~~~~~~

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • bolvar终极杀人王 2011-12-22 16:09  加入黑名单

      虽然AMD正式在国外发布了HD 7970了,不过文中用的资料还是之前的。这种半技术性文档肯定有不足之处,欢迎大家谈论,也欢迎指正。

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    我来评论
    为你推荐