E X P
正努力加载中…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 全文浏览

    ◆ 缓存设计:迈向通用计算的重要一步

      这里打算将GCN架构中的缓存设计单独拿出来,因为以前做AMD显卡架构分析/评测的时候,在官方PDF中很少看到缓存设计的部分,甚至提都很少提到的,而看NVIDIA Fermi架构的官方PDF的时候,发现其中有很大篇幅在讨论Fermi架构的缓存设计,它对图形计算或许影响并不大,但是对通用计算来说,缓存设计相当重要。

    GCN将采用类似CPU那样的多级缓存机制,只是还没到L3级别而已

      由于CU单元中既有矢量ALU单元也有标量ALU单元,GCN的缓存要比CPU缓存更复杂。每个矢量单元有16KB的数据缓存,每四个CU单元再共享16KB标量L1数据缓存和32KB L1指令缓存,所有L1缓存是都可读写的,不像前代那样只支持读取操作。

      L2缓存通过64bit界面与L1相连,它与存储控制器通道数相关联,每通道L2缓存大小为64-128KB,而HD 7970是6条64bit GDDR5控制器,因此其L2缓存大小为384KB-768KB,而且所有L2缓存的数据都是同步相关的,所有CU都可以读取相同的缓存数据。

    GCN的缓存设计专为数据同步/共享有优化

      在GCN架构的缓存设计中,AMD非常注重数据共享与同步,每个CU中的64KB LDS本地缓存都能与L2缓存直接相连,L2缓存虽然与MC控制器相连,但是所有数据都是CU单元共享,并且可与CPU内存数据同步,提高了CPU与GPU的数据交换能力,这对CPU+GPU组成的异构计算大有裨益。

    GCN支持X86虚拟内存

      GCN还有一个重要设计不能不提,那就是支持X86 Virtual Memory(X86虚拟内存)功能,可以将GPU的显存映射为X86处理器可识别的内存,要知道GDDR5的带宽在上百GB/s量级,HD 7970的带宽大约在264GB/s,远高于目前四通道DDR3内存的理论带宽。

      这个功能相当于打通了GPU和CPU数据共享的高速通道,受益的并非只是通用计算,即便是3D游戏也是获益良多。在这方面最明显的一个例子是超大纹理数据的处理,ID的卡马克大神设计的《RAGE》游戏内容并不多,但是游戏的容量达到了20GB以上,这就要“归功”于ID Tech 5引擎的“Megatexture”技术了,超大容量纹理是提高游戏画质立竿见影的方式,但是对硬件来说是个极大的负担。

    有了X86虚拟内存,类似《RAGE》这样超大纹理数据的游戏更方便了

      卡神用自己的软件技术解决了这个问题,但是其他厂商不一定有这个技术,现在有了X86虚拟内存技术,CPU可以直接读取GPU中的数据,减少了速度较慢的系统内存读写过程,超大纹理素材也不再是问题了。

    ×
    热门文章
    1[更新]神舟因被拖欠三亿多货款而起诉京东
    2国内统一的安卓应用商店推出前,豌豆荚等纷纷宣布停止服务
    3微软推Windows 10新预览版:继续深耕图标设计
    4三星误推内部测试信息,但是方式让不少人吓一跳
    5苹果新13英寸MacBook Pro爆料:搭载英特尔i7-1068NG7处理器
    6CD Projekt已经成为欧洲第二大电子游戏公司:仅次于育碧
    7有欧洲零售商上架了一些Comet Lake-S处理器:价格并不美丽
    8A粉不容错过,AMD官方周边店AMD FAN STORE开张啦
    9华为P40系列手机新料:支持WiFi 6+,华为自研
    已有 23 条评论,每一条合规评论都是对我们的褒奖。
    • 游客 2019-01-24 12:10

      В условиях нестабильной экономики, в то время, когда заработная плата и пенсионно ...

      支持(2)  |   反对(1)  |   举报  |   回复

      23#

    • 游客 2017-06-11 14:31

      游客

      结果GCN的2B SIMD最小粒度的执行效率简直惨淡无比··
      2017-06-05 09:51 已有6次举报
    • 支持(0)  |   反对(4)  |   举报  |   回复
    • 不要使用2B一类的侮辱性词汇 你可以说慢 效率低 但请你尊重别人五年多以前的劳动成果

      已有2次举报

      支持(6)  |   反对(0)  |   举报  |   回复

      22#

    • 游客 2017-06-05 09:51

      coffeeshop 高中生

      没拿到卡也犯不着每篇文都要吐炒,有失专业性. Chiphell不是拿到了7970了. 说实话,现在很少来这里,总是拥着N卡,纸上专业分析之后不忘有失实事求事技术本位说些乱七八糟的,连卡都没拿到就能开始唱衰AMD不敢苟同. 可说已经沦为INTEL, NVIDIA的枪站了. 痛心一个沉沦的网站.
      2011-12-29 06:26 已有2次举报
    • 支持(8)  |   反对(5)  |   举报  |   回复
    • 结果GCN的2B SIMD最小粒度的执行效率简直惨淡无比··

      已有6次举报

      支持(0)  |   反对(4)  |   举报  |   回复

      21#

    • 游客 2012-11-26 07:41

      每四个CU共享的16KB标量缓存应该是只读的

      已有2次举报

      支持(0)  |   反对(17)  |   举报  |   回复

      20#

    • 游客 2012-11-26 02:46

      好文章,很专业也比较全面。 再有一个小问题,AMD官网上写的是Graphics Core Next,有个s的,嘿嘿。

      已有2次举报

      支持(1)  |   反对(3)  |   举报  |   回复

      19#

    • luningdq终极杀人王 2012-01-09 00:21

      这次文章真给力,不但大开了眼界学习到知识还能得奖,OH my超能,铁杆儿支持啊

      已有3次举报

      支持(0)  |   反对(3)  |   举报  |   回复

      18#

    • bolvar终极杀人王 2011-12-30 13:49

      网友 [npolor] 的原贴:1楼
      Gprahic这个单词打错了,在介绍GCN简称的时候
      抱歉,现在才看到这个评论,已经更正了。

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      17#

    • 游客 2011-12-29 11:28

      2x%的提升,算是不错了

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      16#

    • 游客 2011-12-29 11:28

      网友 [thesea] 的原贴:1楼
      在通用计算方面,NV似乎领先了两年
      至少在ECC C++这些方面,确实领先了两年

      已有3次举报

      支持(0)  |   反对(16)  |   举报  |   回复

      15#

    • npolor学前班 2011-12-29 09:31

      Gprahic这个单词打错了,在介绍GCN简称的时候

      已有1次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      14#

    • coffeeshop高中生 2011-12-29 06:26

      没拿到卡也犯不着每篇文都要吐炒,有失专业性. Chiphell不是拿到了7970了. 说实话,现在很少来这里,总是拥着N卡,纸上专业分析之后不忘有失实事求事技术本位说些乱七八糟的,连卡都没拿到就能开始唱衰AMD不敢苟同. 可说已经沦为INTEL, NVIDIA的枪站了. 痛心一个沉沦的网站.

      已有2次举报

      支持(8)  |   反对(5)  |   举报  |   回复

      13#

    • 游客 2011-12-25 12:38

      【最后吐槽一下,】支持吐槽!

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      12#

    • 游客 2011-12-24 23:40

      老外那儿有评测你翻译过来不久行了么 等你妹啊

      已有2次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      11#

    • 游客 2011-12-24 19:37

      新代GCN架构确实够强,期待主流级别显卡面市

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      10#

    • 游客 2011-12-24 01:54

      太专业,看不懂啊

      已有2次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      9#

    • 游客 2011-12-24 01:54

      原文由网友 [Guest] 于2011-12-23 21:23:29发表 看过下外网的结论,普遍认为这代游戏,以目前的技术画面已经到顶了(真实级数还远着呢。。。),除非光线追踪这些真的 
      杯具啊

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      8#

    • 游客 2011-12-23 21:23

      看过下外网的结论,普遍认为这代游戏,以目前的技术画面已经到顶了(真实级数还远着呢。。。),除非光线追踪这些真的得到应用,但短期内这仍很难在个人级的硬件上实现。 所以未来一段时期内,显卡会主要向通用计算方向发展(提高运算性能,也是7900设计要做的),至于游戏画面这些的提升相对则会较慢。

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • 游客 2011-12-23 10:03

      不错,这次AMD的改动还是很大的,好象性能也很NB,国外测试7970比580要快20%

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      6#

    • 游客 2011-12-22 18:05

      Tom's hardware 谈论一些改进 用了容易理解的图形.

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 游客 2011-12-22 16:43

      饿,等产品出来了再说吧,悲剧的AMD,终于醒了,不过两年了···

      已有2次举报

      支持(1)  |   反对(1)  |   举报  |   回复

      4#

    • thesea管理员 2011-12-22 16:39

      在通用计算方面,NV似乎领先了两年

      已有2次举报

      支持(0)  |   反对(15)  |   举报  |   回复

      3#

    • h7838354研究生 2011-12-22 16:26

      AMD还是专心做显卡好了!~~~~~~~~~~~~~~~~~~

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • bolvar终极杀人王 2011-12-22 16:09

      虽然AMD正式在国外发布了HD 7970了,不过文中用的资料还是之前的。这种半技术性文档肯定有不足之处,欢迎大家谈论,也欢迎指正。

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    我来评论
    为你推荐