E X P
正努力加载中…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 全文浏览

    Fermi追随者?与GF100架构的对比

      GCN架构一经公布,很多人的第一想法就是AMD要走Fermi路线了。表面上看,GCN抛弃了熟悉的VLIW架构,加强通用计算能力,支持C/C++编程和ECC纠错,这些特点都与2年前的Fermi何其相似,尖酸刻薄的人肯定又要对AMD吐槽了,不过它与Fermi架构以及未来的Kepler架构迟早都要交手,架构上的比拼是免不了的。

    GF100/110架构是由SM单元组成,AMD GCN相对应的就是CU单元

      Fermi家族有两大衍生架构,GTX 480/470的GF100与580/570使用的GF110架构是一条路线,GTX 560及以下的显卡使用的是GF104架构,二者略有不同,这里只以完整版的GF100/110架构为例。

      GF100拥有512个CUDA核心,这512个核心实际上分为16组SM单元(Streaming Multiprocessors),每个SM单元有32个CUDA核心,每个CUDA内核实际又是由1个整数ALU和一个浮点ALU组成,架构类似于现在的CPU内核了。此外,每个SM单元还有4个SFC(Special Function Unit)单元可以执行sin、cos、exp以及rcp等特殊函数。

    GCN架构的设计要点

      Fermi每组SM单元一个周期内可以执行32条指令,而GCN每个CU单元每周期是40 waves,四组SIMD阵列并行运算,每周期就是四线程。

      缓存设计上,每组SM单元有64KB L1缓存,所有SM单元共享768KB L2缓存,而GCN的缓存设计更为复杂,每个CU单元本地缓存也是64KB,但是还有共享的32KB L1指令缓存,标量单元还有额外共享的16KB L1缓存,L2缓存也是768KB大小,而且与所有L1缓存都是互通的,并且可以与内存同步数据,这些设计都是要领先Fermi架构的。

    NVIDIA称Fermi的灵魂是缓存设计、FP64、C++以及ECC等

      当然更多的指标还是相似的,比如都支持C/C++高级语言编程、支持ECC纠错、强化FP64运算。

      看了官方PDF和许多资料之后,还是不能对AMD和NVIDIA架构做个直接判断,因为架构设计只是手段,反映的是双方的设计思路,很难通过某个指标就能判断孰优孰劣,前后代对比还好,这样的纵向对比更难下手。

      个人的感觉是,AMD的GCN架构虽然抛弃了VLIW体系,但是GCN中的CU单元还留着前代的影子,四组SIMD阵列的设计与HD 6970似曾相似,核心运算能力依然是来自64个矢量单元,而Fermi架构看上去精简、高效的多

      GCN的缓存设计比Fermi要复杂,而且非常注重数据的互通以及共享特性,L1与L2、L2与显存、L2与内存都可以同步数据,虚拟X86内存技术对高速数据传输理论会有奇效。

      GCN与Fermi更多的还是相似点,二者的设计方向都是相同的,除了3D渲染还针对通用计算做了强化,C/C++编程语言以及ECC纠错的功能都是为计算准备的。

    ×
    热门文章
    1三大运营商合推5G消息,5G首个杀手级应用矛头直指微信?
    2华为P40系列国行价格公布:最低4188元,最高8888元
    3华为发布智慧屏X65:OLED屏+自研鸿鹄芯片,售价24999元
    4海盗船DARK CORE RGB PRO SE鼠标评测:全而美,就是重
    5[视频]《地铁:离去》、《控制》玩光追+DLSS 2.0?
    6华为发布2020款MateBook X Pro:1TB固态仅需加价3000元
    7华为2020款Matebook X Pro默默升级到十代处理器,首发还优惠卖
    8SK海力士推出PE8000系列企业级低功耗PCIe 4 SSD
    9Fractal Design推出Celsius+系列一体式水冷散热器,全面升级ARGB
    已有 23 条评论,每一条合规评论都是对我们的褒奖。
    • 游客 2019-01-24 12:10

      В условиях нестабильной экономики, в то время, когда заработная плата и пенсионно ...

      支持(2)  |   反对(1)  |   举报  |   回复

      23#

    • 游客 2017-06-11 14:31

      游客

      结果GCN的2B SIMD最小粒度的执行效率简直惨淡无比··
      2017-06-05 09:51 已有6次举报
    • 支持(0)  |   反对(4)  |   举报  |   回复
    • 不要使用2B一类的侮辱性词汇 你可以说慢 效率低 但请你尊重别人五年多以前的劳动成果

      已有2次举报

      支持(6)  |   反对(0)  |   举报  |   回复

      22#

    • 游客 2017-06-05 09:51

      coffeeshop 高中生

      没拿到卡也犯不着每篇文都要吐炒,有失专业性. Chiphell不是拿到了7970了. 说实话,现在很少来这里,总是拥着N卡,纸上专业分析之后不忘有失实事求事技术本位说些乱七八糟的,连卡都没拿到就能开始唱衰AMD不敢苟同. 可说已经沦为INTEL, NVIDIA的枪站了. 痛心一个沉沦的网站.
      2011-12-29 06:26 已有2次举报
    • 支持(8)  |   反对(5)  |   举报  |   回复
    • 结果GCN的2B SIMD最小粒度的执行效率简直惨淡无比··

      已有6次举报

      支持(0)  |   反对(4)  |   举报  |   回复

      21#

    • 游客 2012-11-26 07:41

      每四个CU共享的16KB标量缓存应该是只读的

      已有2次举报

      支持(0)  |   反对(17)  |   举报  |   回复

      20#

    • 游客 2012-11-26 02:46

      好文章,很专业也比较全面。 再有一个小问题,AMD官网上写的是Graphics Core Next,有个s的,嘿嘿。

      已有2次举报

      支持(1)  |   反对(3)  |   举报  |   回复

      19#

    • luningdq终极杀人王 2012-01-09 00:21

      这次文章真给力,不但大开了眼界学习到知识还能得奖,OH my超能,铁杆儿支持啊

      已有3次举报

      支持(0)  |   反对(3)  |   举报  |   回复

      18#

    • bolvar终极杀人王 2011-12-30 13:49

      网友 [npolor] 的原贴:1楼
      Gprahic这个单词打错了,在介绍GCN简称的时候
      抱歉,现在才看到这个评论,已经更正了。

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      17#

    • 游客 2011-12-29 11:28

      2x%的提升,算是不错了

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      16#

    • 游客 2011-12-29 11:28

      网友 [thesea] 的原贴:1楼
      在通用计算方面,NV似乎领先了两年
      至少在ECC C++这些方面,确实领先了两年

      已有3次举报

      支持(0)  |   反对(16)  |   举报  |   回复

      15#

    • npolor学前班 2011-12-29 09:31

      Gprahic这个单词打错了,在介绍GCN简称的时候

      已有1次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      14#

    • coffeeshop高中生 2011-12-29 06:26

      没拿到卡也犯不着每篇文都要吐炒,有失专业性. Chiphell不是拿到了7970了. 说实话,现在很少来这里,总是拥着N卡,纸上专业分析之后不忘有失实事求事技术本位说些乱七八糟的,连卡都没拿到就能开始唱衰AMD不敢苟同. 可说已经沦为INTEL, NVIDIA的枪站了. 痛心一个沉沦的网站.

      已有2次举报

      支持(8)  |   反对(5)  |   举报  |   回复

      13#

    • 游客 2011-12-25 12:38

      【最后吐槽一下,】支持吐槽!

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      12#

    • 游客 2011-12-24 23:40

      老外那儿有评测你翻译过来不久行了么 等你妹啊

      已有2次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      11#

    • 游客 2011-12-24 19:37

      新代GCN架构确实够强,期待主流级别显卡面市

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      10#

    • 游客 2011-12-24 01:54

      太专业,看不懂啊

      已有2次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      9#

    • 游客 2011-12-24 01:54

      原文由网友 [Guest] 于2011-12-23 21:23:29发表 看过下外网的结论,普遍认为这代游戏,以目前的技术画面已经到顶了(真实级数还远着呢。。。),除非光线追踪这些真的 
      杯具啊

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      8#

    • 游客 2011-12-23 21:23

      看过下外网的结论,普遍认为这代游戏,以目前的技术画面已经到顶了(真实级数还远着呢。。。),除非光线追踪这些真的得到应用,但短期内这仍很难在个人级的硬件上实现。 所以未来一段时期内,显卡会主要向通用计算方向发展(提高运算性能,也是7900设计要做的),至于游戏画面这些的提升相对则会较慢。

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • 游客 2011-12-23 10:03

      不错,这次AMD的改动还是很大的,好象性能也很NB,国外测试7970比580要快20%

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      6#

    • 游客 2011-12-22 18:05

      Tom's hardware 谈论一些改进 用了容易理解的图形.

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 游客 2011-12-22 16:43

      饿,等产品出来了再说吧,悲剧的AMD,终于醒了,不过两年了···

      已有2次举报

      支持(1)  |   反对(1)  |   举报  |   回复

      4#

    • thesea管理员 2011-12-22 16:39

      在通用计算方面,NV似乎领先了两年

      已有2次举报

      支持(0)  |   反对(15)  |   举报  |   回复

      3#

    • h7838354研究生 2011-12-22 16:26

      AMD还是专心做显卡好了!~~~~~~~~~~~~~~~~~~

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • bolvar终极杀人王 2011-12-22 16:09

      虽然AMD正式在国外发布了HD 7970了,不过文中用的资料还是之前的。这种半技术性文档肯定有不足之处,欢迎大家谈论,也欢迎指正。

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    我来评论
    为你推荐