◆ Turbo CORE技术解析
虽然目前的主流处理器都是多核心的,但实际上众多的应用程序,包括大多数的游戏,对多核多线程优化不足,少数可能为双核优化,但是能完全利用四核甚至六核的消费级软件更是不多。这样的窘况造成两个极端,一方面部分核心无所事事,却消耗着同样的功耗,另一方面部分核心满负荷运行,恨不得能跑得再快些。
·Turbo CORE简介
在之前AMD为CPU节能做了很多努力,比如Phenom II开始支持的Cool‘n’Quiet 3.0(简称CnQ)技术就是很好的一个例子,CnQ 3.0通过P-States(CPU Performance states)来实现节能,它支持四种P-State状态,其一是全速(P0),其二是最低频率800MHz(P4),不管什么型号都如此,另外还有两种状态,具体频率视型号而定,比如Phenom II X4 955的四种P-State分别为3.2GHz、2.5GHz、2.1GHz和800MHz。
英特尔Turbo Boost技术典型工作示意图 |
CnQ技术只能做到多个核心“同进退”,它可以解决全部核心在轻负载或空闲时的节能问题,但并不能解决部分核心满负载的问题。率先提出解决方案的是英特尔,从Nehalem架构处理器开始支持的Turbo Boost技术能让内核运行动态加速,可以根据需要开启、关闭以及加速单个或多个内核的运行,这样动态的调整可以提高系统和CPU整体的能效比率。
AMD Turbo CORE技术工作示意图 |
现在AMD也有了类似技术,连名字也很类似,即Turbo CORE技术。在当处理器3个核心或者以上空闲时,Turbo CORE就会启动,所有核心电压提升,并且高负载的核心(必须处于P0状态)频率提升400-500MHz,这个状态称之为Boost P-State状态,可以加速这部分核心的运算能力,同时空闲的核心则进入P-State的P4低功耗状态(即频率下降到800MHz),降低它们的动态功耗。
在整个过程中,处理器最大功耗依然会控制在TDP之内,否则Turbo CORE不会生效。
可以看到Turbo CORE是以P-State为依托的,目前至少有两点不如Turbo Boost,一是它不能对单个核心增加电压,而是所有核心都需要加压,这样即使空闲的核心也会额外增加功耗;另一是空闲的核心不能关闭,最多只能达到P-State的P4状态,节能不够彻底。
英特尔的Turbo Boost技术显得更高明一些,它能操作每个核心的电压,并且可以把不需要的核心直接关闭(实际上是进入C-State的C6级深度休眠状态),由于唤醒C6状态需要较长时间(要重新加载数据),可能会造成切换不及引发种种问题,而Nehalem中特殊设计的PCU可以让这个问题变得简单。
Nehalem中有一个特殊控制器,称为PCU(Power Control Unit),有着自己的嵌入式固件,可以有温度、电流、功耗和操作系统等需要的其他输入,在on-die上进行这样的功耗控制,能让电压的升降时间比常规的off-die模式要短,具有更高效的电源管理,同时,PCU监控各核心的性能、状态,它可以智能地决定进入何种功耗/性能状态,而不用去管操作系统的要求。
Turbo CORE实例:两个核心加速运行,其它四个核心进入P4低功耗状态 |
回到Turbo CORE,理论上它可以让六核中的5个核心处于加速模式,不过我们测试只能做到1至3个核心加速,可能是因为TDP超额的原因,至于像六个核心只能“三升三降”的说法是不正确的,那只是默认设置,实际上可以指定加速核心数目的。
另外,Turbo CORE技术是完全基于硬件层面的,默认自动开启并由处理器自身监控,不需要安装任何特殊的软件、驱动或者工具, 甚至不需要用户特别的操作就可以自动完成。有些主板可能需要更新BIOS才能良好支持这一新技术。
·Turbo CORE中的节能模式
对于CPU来说,功耗分为动态功耗和静态功耗两大部分,动态功耗是电路在工作时所消耗的能量,而静态功耗是电路在没有翻转只有供电的情况下,晶体管中漏电流造成的功耗。
在整个功耗中,时钟单元功耗(其它还有数据链路、存储和IO等)所占比例最大,而门控时钟(Clock gating)作为降低时钟单元功耗有效的方法而得到广泛应用,它可以对某些较少使用的时序逻辑进行开关控制使之保持静态,同时以这些时序部件输出相关的组合逻辑也将处于静态,很好地达到关闭子模块或子电路的目的,从而大大降低功耗。
对于Turbo CORE而言,当某核心需要进入低功耗状态,正是通过门控时钟来得以实现的(准确的说应该是可变频率时钟技术),使该核心处于静态模式(比如800MHz)。
实际上,降低功耗最直接的做法就是在不需要电路工作时将它的电源关掉,这样什么动态功耗、静态功耗就全没有了。在需要电路工作时,再把电源打开,这就是门控电源(Power gating)。方法简单,但实现起来却比门控时钟要复杂得多。
当然真正暴力关掉电源将功耗彻底变为0的方式实现上比较难,主要在于唤醒时要花费更多的时间完成数据加载,而采用内部电源管理方式,在短时间的电源关断会是更理想的办法。
英特尔的Turbo Boost就是通过门控电源实现空闲核心关闭的,PCU充当一个内部电源开关网络,一个功耗消耗极小的影子寄存器保持核心断电前的状态,至于何时保存何时恢复,都由PCU来控制完成。
因此从原理上来说,现在的Turbo CORE在节能效果上相比Turbo Boost有所不如。
游客 2011-07-02 13:50
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(2) | 反对(0) | 举报 | 回复
21#
游客 2010-08-14 08:57
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(2) | 反对(1) | 举报 | 回复
20#
游客 2010-08-07 18:35
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(2) | 反对(1) | 举报 | 回复
19#
游客 2010-07-29 06:06
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(4) | 反对(0) | 举报 | 回复
18#
游客 2010-07-29 06:05
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(3) | 反对(1) | 举报 | 回复
17#
游客 2010-07-29 06:05
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(2) | 反对(0) | 举报 | 回复
16#
游客 2010-06-10 09:33
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(2) | 反对(0) | 举报 | 回复
15#
游客 2010-06-07 10:19
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(2) | 反对(0) | 举报 | 回复
14#
游客 2010-06-01 21:02
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(2) | 反对(0) | 举报 | 回复
13#
游客 2010-05-11 12:22
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(2) | 反对(0) | 举报 | 回复
12#
超能网友研究生 2010-05-03 16:12 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(2) | 反对(0) | 举报 | 回复
11#
游客 2010-04-28 23:11
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(2) | 反对(0) | 举报 | 回复
10#
游客 2010-04-28 17:27
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(2) | 反对(0) | 举报 | 回复
9#
游客 2010-04-28 16:17
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(2) | 反对(0) | 举报 | 回复
8#
游客 2010-04-28 14:17
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(2) | 反对(0) | 举报 | 回复
7#
游客 2010-04-28 13:46
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(2) | 反对(0) | 举报 | 回复
6#
游客 2010-04-28 11:33
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(2) | 反对(0) | 举报 | 回复
5#
游客 2010-04-28 11:15
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(2) | 反对(0) | 举报 | 回复
4#
超能网友小学生 2010-04-28 10:55 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有4次举报支持(2) | 反对(0) | 举报 | 回复
3#
游客 2010-04-28 10:06
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(2) | 反对(0) | 举报 | 回复
2#
超能网友终极杀人王 2010-04-28 09:57 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(2) | 反对(0) | 举报 | 回复
1#