SNB系列第六弹,Turbo Boost 2.0加速技术解析

2011-1-3 11:03  |  作者:thesea   |  关键字:Sandy Bridge,Turbo Boost,睿频

   随着Intel的Tick-Tock周期更新,新一代的Sandy Bridge也即将正式亮相,新一代Turbo Boost 2.0也随之登场。<br><br>  等到Sandy Bridge正式上市之后,在Turbo Boost 2.0的加速下可以达到3.8GHz的高频,日后甚至可以藉此一圆P4时代未竟的4G梦想。

本文约2736字,需5分钟阅读

  目前的桌面CPU市场上,双核CPU毫无疑问地成为装机首选,四核或更多核心的CPU占有率依然比较低,这固然与它们高昂的售价有直接关系,但是多核CPU还有一个难言之隐,那就是在部分应用场合中它们的性能有时都比不过双核甚至单核CPU,消费者的选择意愿不足。

  多核CPU囿于TDP功耗的限制,其频率并不会很高(旗舰级除外),例如英特尔四核Core i5-750的频率为2.66GHz,而双核的Core i5-650就有3.2GHz,除了针对多核做过优化的软件及游戏应用外,i5-650的性能大都要高过i7-750,考虑到两者售价上的大幅差异,这样的事实很难让消费对多核处理器青睐有加。为了解决这个问题,CPU厂商需要在多核力量大与高频性能高之间做个平衡,在需要高频率的时候动态提升多核CPU的频率。

  两大CPU厂商中最先拿出解决方案的是财大气粗的Intel,它为Nehalem架构的新一代Core i7/i5处理器引入了一种名为Turbo Boost(睿频)的核心/频率动态调节技术,这一技术也是酷睿2时代IDA(Intel Dynamic Acceleration Technology,Intel动态加速技术)的延伸,当时IDA可以休眠CPU中的一个核心而提升另一个核心的运行频率,现在的睿频技功能更强,可以实现多个核心的动态加速。

Turbo Boost加速技术原理分析
 


Nehalem处理器中的PCU单元

  Nehalem架构的CPU每一个核心都有自己的PLL(Phase Locked Loop,相位锁定回路)电路,这样每个核心的电压和频率都可以独立控制,为此Intel专门在CPU内部设计了PCU(Power Control Unit,功耗控制)单元,PCU会以1ms(每秒1000次)的速度实时监测这四个核心的温度、电流及功耗等参数。独立控制的状态参数也是Turbo Boost加速的物理基础。


不同C-State下的功耗水平与活动状态

  除独立的物理电路之外,Turbo Boost还需要Deep Power Down Technology技术(深度电源管理模式)的辅助,它将CPU内核按照不同的活动状态分类,历经多代技术之后目前有C0、C1、C3、C4和C6等几种状态,其中C1为工作模式表示当前正在执行指令,C1到C6则为不同的省电模式。其中值得注意是C6状态,此状态下处理器可实时清除L1 Cache内所有数据,在保存处理器微架构状态下,关掉内核(Core Clock与PLL将停止)及L2 Cache,虽然芯片组会继续为I/O提供内存交换动作,但却不会唤醒相关内核。只有需要内核时,电压才会攀升,开启Core Clock与PLL,处理器将进行重置,把Cache数据从内存中回传,微架构状态将完全恢复,继续执行指令。

   C0和C1状态的核心被视为Active core,而C3和C6两种状态则被视为Unactive core,每个核心处于Active还是Unactive成为Turbo Boost加速开启与否的重要因素。

  根据Intel的官方文档分析,Turbo Boost会受到以下因素影响:

    1.CPU型号
    2.处于Active状态的内核数量
    3.TDP功耗
    4.内核的电流
    5.内核的功耗
    6.内核的温度

  其中第一个限制其实是人为的,并不存在技术上的障碍,真正影响Turbo Boost的2、4、5、6这四项,一旦实际应用不能完全利用所有核心导致出现Unacive内核,睿频加速就开始发挥作用。

  汇总一句话,Turbo Boost实际上就是PCU单元不断监测CPU内每个核心的状态,一旦有一个或多个多个内核处于Unactive状态,PCU就会自动提升处于Active状态的内核的运行频率,直到达到TDP限制。提升幅度以bin为计量,在现在Nehalem架构中1 bin=bclk频率,也就是133.33MHz,每个CPU型号提升的幅度取决于基础频率以及TDP上限,普通型号的TDP上限不超过140W,旗舰级的EE版则可以放宽到190W。

  多数桌面型号处理器的Turbo Boost可以提升幅度都在1-2 bins,只有个别特殊型号才可以达到5-7 bins,其中基础频率越低提升越明显,节能型的提升要高于标准型的,32nm工艺的则要好于45nm工艺的老型号,这也再次说明了TDP功耗高低决定了Turbo Boost加速的上限。

Turbo Boost 2.0有望带来更多变化

  Turbo Boost技术是跟着Nehalem架构出现的,随着Intel的Tick-Tock周期更新,新一代的Sandy Bridge也即将正式亮相,新一代Turbo Boost 2.0也随之登场,它在原有的基础上改进了算法,增强了自动提速的弹性,甚至可以动态调控集成的GPU的频率。

亮点一:Turbo Boost 2.0可以突破TDP硬上限

  Turbo Boost加速的智能性并不代表它是完美无缺的,TDP功耗成为频率提升的硬上限,一旦达到TDP功耗,CPU频率就会降至正常值,大部分桌面级CPU的提升只有1-2 bins左右,CPU实际性能提升只能说是聊胜于无,而在Turbo Boost 2.0技术的帮助下,CPU的提升会达到3-10 bins,在低功耗版本中,可提升幅度最大。


Turbo Boost 2.0可以短时间突破TDP功耗限制

  在Turbo Boost 2.0中,TDP方面的限制有所放松,PCU单元可以控制active core在较短时间内突破TDP上限之后才会逐渐降至稳定状态,IDF会议上的资料显示最高峰阶段长达25秒,不要小看这一点时间,这只是一个加速周期循环,等到CPU的发热被带走之后,Turbo Boost 2.0也会进入下一个25秒的加速循环,这样累积下来的提速效果将比目前1-2 bins的提升更为明显。最重要的是,用户也不必担心这样做会损坏CPU,因为短时间超越TDP功耗依然处于安全设计内,Intel不会做这种亏本生意的。

亮点二:Turbo Boost 2.0联动加速CPU和内置GPU

  另一个值得注意的功能是Turbo Boost 2.0中不仅能调节CPU频率,也会对集成GPU同样也会起到加速作用,并随着系统负载的不同协调二者的频率升降。

  在今年发布的clarksfield核心的i5、i3处理器中,Intel已把GPU集成到CPU而非芯片组中,虽然当时只是将二者封装在一起,但是我们之前的测试中,已经揭示了GPU频率与BCLK频率存在联动关系


CPU与GPU功耗的一体化管理

  到了SNB架构中,GPU将会与CPU真正集成在一个核心内,二者的关系会更密切,Turbo Boost 2.0也会一体化管理GPU和CPU的能耗,并在需要的时候动态提升GPU的频率。这种改变带来的影响也会更大,例如多数游戏中CPU性能都是过剩的,Turbo Boost 2.0可以根据系统负载而向GPU倾斜,大幅提升GPU的频率以改善性能,再加上SNB中GPU架构的革新带来的性能提升,Intel新一代CPU的图形性能有可能咸鱼翻身,进而颠覆整个低端CPU/主板市场。


Turbo Boost 2.0将会带来更多收益

  等到Sandy Bridge架构的CPU正式上市之后,凭借先进的32nm High-K工艺所带来的低功耗、低发热优势,Turbo Boost 2.0加速无疑有了更大的发挥空间。SNB架构的CPU频率覆盖2.2-3.4GHz,像Core i7-2600默认为3.4GHz,在Turbo Boost 2.0的加速下四个核心可以达到3.8GHz,单核心甚至能达到4.2GHz的高频,可以藉此一圆P4时代未竟的4G梦想。

亮点三:新增Turbo Boost监控软件


Turbo Boost 2.0新增有频率变化监控器

  Turbo Boost 2.0有相应的监控软件,可以即时显示CPU的频率变化,界面很美观,就是一CPU外形,像Core i5-2500的默认频率为3.3GHz,界面上根据频率的变化显示相应的数值和柱状图,如3.5GHz,超出部分的颜色会有所区别,非常直观和人性化,方便用户监控。

结语


SNB处理器Turbo Boost加速后的频率

  目前多核处理器已是占据了大部分市场份额,但是软件方面的多线程优化尚未完全准备好,以致于出现高价的多核CPU性能不及低价的双核乃至单核的尴尬,Turbo Boost技术的出现有其现实意义,实际使用中支持此技术的多核CPU犹如吃了大补丸,或多或少总会由此受益。

   Turbo Boost归根到底要依赖于厂商的CPU功耗管理技术,这也一直是Intel的强项所在,它不需要用户干预,频率的升降都是一瞬间完成的,智能度非常高,Turbo Boost 2.0的出现进一步提高了动态调频的灵活性及空间,而对GPU的动态加速更能让人兴奋,以往纠结于Intel集显性能低下的玩家有可能找到新的灵丹妙药根治这一顽疾。

  唯一让人诟病Turbo Boost的地方在于Intel将之视为筹码,是否支持Turbo Boost成为CPU等级划分的一个依据,不太需要这个功能中高端CPU往往都支持这一功能以彰显其优势,而真正需要Turbo Boost加速提升性能的入门和性能级CPU则大都不受Turbo Boost青睐,要改变这一点,还是希望AMD类似的Turbo Core加速技术给Intel施加更大的压力吧。
 


  • 游客  2015-12-23 10:54

    A rolling stone is worth two in the bush, thanks to this arlicte.

    已有9次举报

    支持(1)  |   反对(1)  |   举报  |   回复

    6#

  • 游客  2014-09-12 03:18

    请问Laptop core I5 可以换成 core I7的吗?

    已有2次举报

    支持(0)  |   反对(0)  |   举报  |   回复

    5#

  • 游客  2011-02-17 00:16

    Trans-Am系统?

    已有2次举报

    支持(0)  |   反对(0)  |   举报  |   回复

    4#

  • 云瑞终极杀人王 2011-01-06 20:18

    好东西,就是买不起~

    已有2次举报

    支持(0)  |   反对(0)  |   举报  |   回复

    3#

  • 游客  2011-01-03 16:52

    网友 [hi_templar] 的原贴:1楼
    TB看起来灵活加给力,实际折射出4核6核处理器在没有相应软件优化前提下的尴尬与无奈,就像当年P4的超线程技术,实属不得已而为之,绝非神马秘密武器。
    p4的超线程是intel自己蛋痛,弄了个超长的流水线,执行程序完全没效率的补偿方案

    已有2次举报

    支持(0)  |   反对(1)  |   举报  |   回复

    2#

  • hi_templar高中生 2011-01-03 14:44

    TB看起来灵活加给力,实际折射出4核6核处理器在没有相应软件优化前提下的尴尬与无奈,就像当年P4的超线程技术,实属不得已而为之,绝非神马秘密武器。

    已有2次举报

    支持(0)  |   反对(0)  |   举报  |   回复

    1#

查看全部评论(6)

回复