E X P
正努力加载中…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 全文浏览

    ◆ 高度共享,弹性浮点单元解析

      前文提到的性能提升80%是有条件的,运算是整数型的才可能有如此幅度的提升,虽然浮点运算只占20%左右,一旦遇到技术与商业领域中常用到的浮点计算,一组浮点单如何满足性能需要也成了关键,对此AMD给出的解决方式是增强浮点单元的弹性,运算指令可拆分可合并以适应不同情况。

    Bulldozer的Flex FP浮点单元为两个整数单元所共享使用

      按照AMD官方博客指出的那样,Bulldozer的Flex FP虽然为两组整数单元共享,但是它拥有独立的浮点调度器,并不依赖整数单元的调度器来分配指令,同时也不占用整数单元的资源来排定256位的执行方式。相比之下,Intel的CPU架构中整数单元和浮点单元共用一组调度器,需要同时分配整数和浮点运算的指令。

      Bulldozer的Flex FP单元也会支持SSE3、SSE4.1/4.2、AES、AVX以及AMD演化自SSE5的FMA4、XOP和PCLMULQDQ等多种指令,前面的几种早已得到支持,AVX则是最新的指令集,Intel也只是在刚刚发布的SNB架构CPU上首次使用。

      Intel改进了SNB的浮点单元,将16个XMM寄存器改为256位的YMM寄存器,并去掉了现有架构中只能载入/储存128位指令的限制,因此每周期可以执行一个256位FP ADD(浮点加)或者FP Multiply(浮点乘)指令,同时配以更大的缓冲器(Buffer)以匹配位宽提升。

    Flex FP浮点单元由两个128位FMAC单元组成

      Bulldozer同样支持256位AVX指令,但是支持方式与SNB有所不同。它的浮点单元由两个128位FMAC(Fused Multiply-accumulate )单元组成,这个浮点单元通用性很强,每周期可以执行任意一个FAMC(Floating-Point Multiply-Accumulators,浮点累积乘)、FADD(Floationg Point Addition,浮点加)或者FMUL(Floationg Point Multiplication,浮点乘)计算,相比之下Intel的浮点单元功能较为专一,FADD和FMUL计算需要专用的FADD及FMUL管线。AMD的浮点单元的好处是针对不同的浮点计算有充足的弹性空间,如果指令是256位的,那么两个FAMC单元可以合并为一个256位浮点单元计算,如果指令不是256位的而是128位的,那么FAMC单元可以同时执行两个同样的FADD或FMUL指令。

      对于另一个AES(Advanced Encryption Standard)指令,只要是符合FIPS 197标准的,Flex FP也能提供硬件加速,而且每周期可以操作16B指令。AES加速功能主要针对商用市场,现有的八核Xeon至强处理器拥有8个浮点单元,Bulldozer的的服务器版Interlagos最多会有16个Flex FP单元,其运算带宽会两倍于现有产品。

      Flex FP浮点单元拥有高弹性、高通用性的优点,Bulldozer因此可以少设计一组浮点单元,这样不仅减少了核心面积,同时也降低了功耗,因为在不执行256位AVX指令的时候(目前支持AVX指令的应用尚且不多)大多只用到一个128位FMAC单元,其空闲功耗可以降至峰值功耗的2%。

    ×
    热门文章
    1微星推出4款龙魂系列机箱新品:售价299元起
    2高通发布骁龙865 Plus处理器:唯一关键词超频,超大核主频提升到3.1GHz
    3【7.9更新】当当称李国庆撬保险柜抢资料,李国庆回应接管当当开始办公
    4超能课堂(236):850W电源会比550W电源更耗电吗?
    5Intel正式推出Thunderbolt 4标准:兼容USB4,支持8K显示输出
    6NVIDIA股票大涨,市值一度超越Intel成为全美第一半导体公司
    7尽管苹果努力控制新iPhone的成本,但iPhone 12起售价仍将上涨50美元
    8HMS Core 5.0正式上线,华为将在9月11日发布鸿蒙OS 2.0
    9技嘉主板新BIOS解决SMM安全漏洞,500系主板已可下载
    已有 34 条评论,每一条合规评论都是对我们的褒奖。
    • 游客 01-15 17:11

      Greetings from Colorado! I’m bored to death at work so I decided to browse your site on my iphone during lunch break.

      支持(0)  |   反对(0)  |   举报  |   回复

      34#

    • 游客 2017-05-09 18:53

      qygAZX Really informative blog.Really thank you! Awesome.

      支持(0)  |   反对(0)  |   举报  |   回复

      33#

    • 游客 2016-11-27 05:11

      oGzVwP UVB Narrowband Treatment Is a computer science degree any good for computer forensics?

      支持(0)  |   反对(0)  |   举报  |   回复

      32#

    • 游客 2016-08-03 22:33

      CH8Fd7 This very blog is really cool and besides amusing. I have discovered many interesting things out of it. I ad love to visit it over and over again. Thanks a lot!

      支持(0)  |   反对(0)  |   举报  |   回复

      31#

    • 游客 2016-05-16 04:03

      DdDiAl you might have a fantastic weblog here! would you like to make some invite posts on my weblog?

      支持(0)  |   反对(0)  |   举报  |   回复

      30#

    • 游客 2016-05-16 01:22

      TKZPAV Spot up with Spot up with this write-up, I honestly feel this website needs additional consideration. I all apt to be again to learn to read considerably more, many thanks for that information.

      支持(0)  |   反对(0)  |   举报  |   回复

      29#

    • 游客 2016-05-13 22:25

      Thanks for sharing, this is a fantastic article.Really thank you! Keep writing.

      支持(0)  |   反对(0)  |   举报  |   回复

      28#

    • 游客 2016-03-31 07:33

      TqWthO I wanted to start making some money off of my blog, how would I go about doing so? What about google adsense or other programs like it?.

      支持(0)  |   反对(0)  |   举报  |   回复

      27#

    • 游客 2016-03-31 03:33

      W4Lvy8 Sick! Just received a brand-new Pearl and I can now read your blog on my phone as browser, it didn at operate on my old one.

      支持(0)  |   反对(0)  |   举报  |   回复

      26#

    • 游客 2016-01-01 23:49

      zmBrfP

      支持(0)  |   反对(0)  |   举报  |   回复

      25#

    • 游客 2015-11-10 04:35

      KNzjLM It'а†s really a great and useful piece of info. I'а†m glad that you just shared this helpful info with us. Please keep us informed like this. Thank you for sharing.

      支持(0)  |   反对(0)  |   举报  |   回复

      24#

    • 游客 2015-11-09 05:22

      oSA7fD Really appreciate you sharing this article.Really looking forward to read more.

      支持(0)  |   反对(0)  |   举报  |   回复

      23#

    • 游客 2015-10-16 10:06

      L0en9A I think this is a real great article post.Thanks Again. Great.

      支持(0)  |   反对(0)  |   举报  |   回复

      22#

    • 游客 2014-08-04 12:31

      OmZDoY Im thankful for the post.Really thank you! Awesome.

      支持(0)  |   反对(0)  |   举报  |   回复

      21#

    • eneiwlyh 2013-03-14 10:44  加入黑名单

      AMD 推土机 全系列现货 有咨询加 QQ 499686668

      支持(0)  |   反对(0)  |   举报  |   回复

      20#

    • 游客 2011-05-29 00:35

      没有竞争就没有进步,我不怀疑2大芯片厂的厮杀是不好的事,获利的即是用户也是他们。AMD一定要加紧脚步,产品实实在在的投产,抢滩登陆才是重点。 “没钱可以找中国融资嘛,我们有的是钱。这个代价嘛,换你点技术就可以啦”。

      支持(1)  |   反对(0)  |   举报  |   回复

      19#

    • RobinO教授 2011-05-27 02:11  加入黑名单

      一旦Llano处理器问世,那么整合的GPU核心浮点性能远高于目前的CPU,未来不排除AMD将CPU的浮点功能转移到GPU核心上,这样才真正实现Fusion熔合的理念。 “熔合”??应该是“融合”吧。 已经都“熔”了,AMD还怎么玩。。。。。。。。。。。。。。

      支持(0)  |   反对(0)  |   举报  |   回复

      18#

    • bolvar终极杀人王 2011-05-26 12:41  加入黑名单

      网友 [Guest] 的原贴:1楼
      AES(Advanced Encryption Standard,高密度加速标准)指令 这个翻译有够雷的,还不如不译。 直译是 “高级加密标准”,
      网友 [Guest] 的原贴:2楼
      Encryption 在这里应该翻译为“编码”
      当时找资料上这个翻译是在AMD台湾公司的一个PDF上找到的,直接引用的。有些翻译可能是见仁见智的问题,为了避免无谓的争论,还是去掉翻译吧,反正知道的人都知道是怎么回事。

      支持(0)  |   反对(0)  |   举报  |   回复

      17#

    • 游客 2011-05-26 12:25

      网友 [Guest] 的原贴:1楼
      AES(Advanced Encryption Standard,高密度加速标准)指令 这个翻译有够雷的,还不如不译。 直译是 “高级加密标准”,
      Encryption 在这里应该翻译为“编码”

      支持(1)  |   反对(0)  |   举报  |   回复

      16#

    • 游客 2011-05-26 01:35

      AES(Advanced Encryption Standard,高密度加速标准)指令 这个翻译有够雷的,还不如不译。 直译是 “高级加密标准”,

      支持(0)  |   反对(0)  |   举报  |   回复

      15#

    • bolvar终极杀人王 2011-05-25 14:07  加入黑名单

      网友 [Guest] 的原贴:1楼
      着重要作用的"HyperThread"(HT) 是HYPERTRANSPORT才對吧= =
      是,后面写HT超线程写顺手了。

      支持(0)  |   反对(0)  |   举报  |   回复

      14#

    • 游客 2011-05-25 13:15

      着重要作用的"HyperThread"(HT) 是HYPERTRANSPORT才對吧= =

      支持(0)  |   反对(0)  |   举报  |   回复

      13#

    • 游客 2011-05-25 12:32

      原文由网友 [Guest] 于2011-05-24 19:11:29发表 `amd的产能从哪儿来?K8全面压制p4的时候amd的u很难买啊
      從K6-2開始,AMD就已經受到產能不足嘅困擾,一直到AMD出售生產線為止,現在AMD的產能理論上已經不是問題了,就是AMD下多少訂單而已。

      支持(0)  |   反对(0)  |   举报  |   回复

      12#

    • 游客 2011-05-25 11:44

      现在来看,推土机的价格比i5高多了 如果连i5都干不掉还咋混啊

      支持(0)  |   反对(0)  |   举报  |   回复

      11#

    • ponndodoru大学生 2011-05-25 11:34  加入黑名单

      很客观,好文。一如既往的支持超能

      支持(0)  |   反对(0)  |   举报  |   回复

      10#

    • 头发乱了小学生 2011-05-25 08:51  加入黑名单

      好文 楼主辛苦了······我换了 AM3+ 的主板就等推土机来了

      支持(0)  |   反对(0)  |   举报  |   回复

      9#

    • 游客 2011-05-24 19:11

      网友 [Guest] 的原贴:1楼
      AMD的路无疑还是对的,入门用整合的Llano,中端用推土机,高端直接放弃,市场太小,或者和服务器一样,只能用价格和Intel玩了,损失不会太大,但CPU市场已经固化了,AMD再多估计也就拿到25%,不太可能有大突破,除非有突破性的产品推出。
      `amd的产能从哪儿来?K8全面压制p4的时候amd的u很难买啊

      支持(0)  |   反对(0)  |   举报  |   回复

      8#

    • 游客 2011-05-24 19:08

      http://www.t-ram.com/news/news.html 感觉tram是个悲剧啊

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • 游客 2011-05-24 18:56

      继续用08年入的Q9550....还能再用3年不成问题啊

      支持(0)  |   反对(0)  |   举报  |   回复

      6#

    • 游客 2011-05-24 18:34

      8模AMD CPU 連 2600K都打的差不多 那intel繼續6核心 999賣下去就好... 反正對手追不上來~ intel 8核不及者見面XD 藍大 綠小 的格局會繼續挺進到2012年....

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    加载更多评论

    我来评论
    为你推荐