E X P
正努力加载中…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 全文浏览

    ◆ CU单元:矢量与标量运算的混合体

      既然基本组成是CU单元了,那么每个CU单元又是什么样的设计呢?

    一个CU单元除了相应的缓存、预测以及控制部分,核心运算单元主要还是大大的红色矢量单元

      一个CU单元主要是由指令预读中断、控制/解码、预测、标量单元、矢量单元以及相应的缓存组成,核心运算单元就是其中的Scalar标量和Vector Units矢量单元了。

    矢量单元实际是四组SIMD阵列,它们并行运作组成了GCN的MIMD体系

      说GCN的基础还是SIMD体系是因为其中每组SIMD每周期执行的依然是64个FMAD(乘加指令)矢量运算,但是四组SIMD阵列同步运行使得每个CU单元每周期可以执行4线程,具备了MIMD体系的特点。只是需要注意的是,GCN架构中的SIMD阵列所指的是CU中矢量单元的组成部分,而在HD 6970架构中,其SIMD阵列地位相当于GCN的CU,弄清这两个SIMD所指代的含义之后就好理解多了。

    这张图看上去更好理解CU单元的四组SIMD阵列都是由16个矢量SIMD单元组成的(图片来源:Aanandtech)

      Aanandtech网站的这张CU结构图可以更好地理解每个CU单元的具体构成,其中每组SIMD阵列实际上是由16个ALU矢量单元组成,这样一个CU单元就有64个ALU单元,32个CU组成了GCN架构的2048个计算单元。

    AMD在另一份文档上展示的CU单元详细结构图

      每个CU单元还有1个标量ALU,并有独立的标量解码器,不过寄存器只有8KB大小,ALU也只支持整数(Integer)计算,这表明GCN架构革命并不彻底。

    VLIW 4架构与4 SIMD non-VLIW架构的比较

      与VLIW 4架构相比,non-VLIW架构最大的变化是执行方式,VLIW 4虽然每周期执行4次操作(ops),实际上还是1条指令,而且非常依赖指令组合,需要极强的调度管理,而non-VLIW架构虽然每次只能执行1个ALU操作,但是4组SIMD依然能保证执行4条线程,而且每项操作都是占用(occupancy)式的,利用率接近100%(close to 100%)。看AMD自己的描述,VLIW 4架构大都是用“特殊的、困难的、复杂的、较少的”这样的字眼来形容,而non-VLIW架构就是“简单的、标准的”,评价态度就证明了两种架构的高下之分。

    ×
    热门文章
    1AMD:别急,135+款搭载锐龙4000系列处理器的笔记本蓄势待发
    2Sony正式披露新一代PlayStation手柄DualSense:美而强大
    3三大运营商合推5G消息,5G首个杀手级应用矛头直指微信?
    4AMD还准备了超低功耗的锐龙9,Ryzen 9 4900U处理器曝光
    5戴尔或要推出XPS 17,将采用XPS 13 9300的同款全面屏设计
    6苹果Apple Pay公交卡上新,支持全国数百城市刷卡
    7一加8系列确认支持无线充电,刘作虎称充电速度几乎和有线一样快
    8Intel停产四款Kaby Lake Refresh处理器:低压平台最早的四核心产品
    9海盗船DARK CORE RGB PRO SE鼠标评测:全而美,就是重
    已有 23 条评论,每一条合规评论都是对我们的褒奖。
    • 游客 2019-01-24 12:10

      В условиях нестабильной экономики, в то время, когда заработная плата и пенсионно ...

      支持(2)  |   反对(1)  |   举报  |   回复

      23#

    • 游客 2017-06-11 14:31

      游客

      结果GCN的2B SIMD最小粒度的执行效率简直惨淡无比··
      2017-06-05 09:51 已有6次举报
    • 支持(0)  |   反对(4)  |   举报  |   回复
    • 不要使用2B一类的侮辱性词汇 你可以说慢 效率低 但请你尊重别人五年多以前的劳动成果

      已有2次举报

      支持(6)  |   反对(0)  |   举报  |   回复

      22#

    • 游客 2017-06-05 09:51

      coffeeshop 高中生

      没拿到卡也犯不着每篇文都要吐炒,有失专业性. Chiphell不是拿到了7970了. 说实话,现在很少来这里,总是拥着N卡,纸上专业分析之后不忘有失实事求事技术本位说些乱七八糟的,连卡都没拿到就能开始唱衰AMD不敢苟同. 可说已经沦为INTEL, NVIDIA的枪站了. 痛心一个沉沦的网站.
      2011-12-29 06:26 已有2次举报
    • 支持(8)  |   反对(5)  |   举报  |   回复
    • 结果GCN的2B SIMD最小粒度的执行效率简直惨淡无比··

      已有6次举报

      支持(0)  |   反对(4)  |   举报  |   回复

      21#

    • 游客 2012-11-26 07:41

      每四个CU共享的16KB标量缓存应该是只读的

      已有2次举报

      支持(0)  |   反对(17)  |   举报  |   回复

      20#

    • 游客 2012-11-26 02:46

      好文章,很专业也比较全面。 再有一个小问题,AMD官网上写的是Graphics Core Next,有个s的,嘿嘿。

      已有2次举报

      支持(1)  |   反对(3)  |   举报  |   回复

      19#

    • luningdq终极杀人王 2012-01-09 00:21

      这次文章真给力,不但大开了眼界学习到知识还能得奖,OH my超能,铁杆儿支持啊

      已有3次举报

      支持(0)  |   反对(3)  |   举报  |   回复

      18#

    • bolvar终极杀人王 2011-12-30 13:49

      网友 [npolor] 的原贴:1楼
      Gprahic这个单词打错了,在介绍GCN简称的时候
      抱歉,现在才看到这个评论,已经更正了。

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      17#

    • 游客 2011-12-29 11:28

      2x%的提升,算是不错了

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      16#

    • 游客 2011-12-29 11:28

      网友 [thesea] 的原贴:1楼
      在通用计算方面,NV似乎领先了两年
      至少在ECC C++这些方面,确实领先了两年

      已有3次举报

      支持(0)  |   反对(16)  |   举报  |   回复

      15#

    • npolor学前班 2011-12-29 09:31

      Gprahic这个单词打错了,在介绍GCN简称的时候

      已有1次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      14#

    • coffeeshop高中生 2011-12-29 06:26

      没拿到卡也犯不着每篇文都要吐炒,有失专业性. Chiphell不是拿到了7970了. 说实话,现在很少来这里,总是拥着N卡,纸上专业分析之后不忘有失实事求事技术本位说些乱七八糟的,连卡都没拿到就能开始唱衰AMD不敢苟同. 可说已经沦为INTEL, NVIDIA的枪站了. 痛心一个沉沦的网站.

      已有2次举报

      支持(8)  |   反对(5)  |   举报  |   回复

      13#

    • 游客 2011-12-25 12:38

      【最后吐槽一下,】支持吐槽!

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      12#

    • 游客 2011-12-24 23:40

      老外那儿有评测你翻译过来不久行了么 等你妹啊

      已有2次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      11#

    • 游客 2011-12-24 19:37

      新代GCN架构确实够强,期待主流级别显卡面市

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      10#

    • 游客 2011-12-24 01:54

      太专业,看不懂啊

      已有2次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      9#

    • 游客 2011-12-24 01:54

      原文由网友 [Guest] 于2011-12-23 21:23:29发表 看过下外网的结论,普遍认为这代游戏,以目前的技术画面已经到顶了(真实级数还远着呢。。。),除非光线追踪这些真的 
      杯具啊

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      8#

    • 游客 2011-12-23 21:23

      看过下外网的结论,普遍认为这代游戏,以目前的技术画面已经到顶了(真实级数还远着呢。。。),除非光线追踪这些真的得到应用,但短期内这仍很难在个人级的硬件上实现。 所以未来一段时期内,显卡会主要向通用计算方向发展(提高运算性能,也是7900设计要做的),至于游戏画面这些的提升相对则会较慢。

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • 游客 2011-12-23 10:03

      不错,这次AMD的改动还是很大的,好象性能也很NB,国外测试7970比580要快20%

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      6#

    • 游客 2011-12-22 18:05

      Tom's hardware 谈论一些改进 用了容易理解的图形.

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 游客 2011-12-22 16:43

      饿,等产品出来了再说吧,悲剧的AMD,终于醒了,不过两年了···

      已有2次举报

      支持(1)  |   反对(1)  |   举报  |   回复

      4#

    • thesea管理员 2011-12-22 16:39

      在通用计算方面,NV似乎领先了两年

      已有2次举报

      支持(0)  |   反对(15)  |   举报  |   回复

      3#

    • h7838354研究生 2011-12-22 16:26

      AMD还是专心做显卡好了!~~~~~~~~~~~~~~~~~~

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • bolvar终极杀人王 2011-12-22 16:09

      虽然AMD正式在国外发布了HD 7970了,不过文中用的资料还是之前的。这种半技术性文档肯定有不足之处,欢迎大家谈论,也欢迎指正。

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    我来评论
    为你推荐