◆ VLIW 5、VLIW 4再到non-VLIW的进化
有关AMD以及NVIDIA的GPU架构的讨论文章有过很多,以致于架构设计的不同也成为双方以及双方大军互相攻讦之处,技术上的细节先不去管他(包括笔者在内的大部分人也不懂这么多),我们只需要知道NVIDIA自从DX10统一渲染架构改走是1D标量、MIMD(多指令多数据)体系,而AMD从HD 2900开始的R600架构开始就是不断改良原先的4D矢量、SIMD(单指令多数据)体系。
VLIW 5:AMD图形架构的根基
即便流处理器单元数量翻了几番,目前AMD显卡的微观架构还是没有什么太大变化的。DX9及之前的显卡渲染要分为顶点渲染(vertex shader)和像素渲染(pixel shader),分别计算像素的位置参数XYZW以及色彩参数RGBA,正好都是4次运算,这就是图形计算的4D矢量运算,在DX10以前双方显卡比拼的就是vs单元和ps单元的数量,或许还有人记得评价显卡运算能力的一个重要参数---三角形生成能力。
到了DX10时代,微软的DX API取消了顶点渲染器和像素渲染器之分,改成统一处理器(Unitied Processor),图形渲染中标量运算越来越多,单纯的矢量运算分成在减少,为此NVIDIA推倒重来设计了G80这样的1D标量处理器,而AMD并未完全放弃4D矢量架构,而是在此基础上做了一些改良,增加了一个标量运算单元,AMD称之为Superscalar超标量单元,形成了4D+1D的矢量标量混合架构,这便是VLIW 5架构的由来。
AMD显卡的主流架构依然是VLIW 5体系 |
所谓VLIW是Very Long Instruction Word(超长指令口令)的简称,它可以把需要的计算指令组合成适合4D+1D架构的长指令,这样理论上每个统一处理器秒周期可以执行5次计算,而这5个运算单元(ALU)只需要一个发射端口,电路设计简单多了,功耗和发热也容易控制,缺点就是依赖指令组合,一旦非最优指令组合,运算效率就低多了。
VLIW 5架构由4个矢量单元外加1个标量单元组成,运算需要适当的指令组合 |
VLIW 4:HD 6900首次改变
虽说VLIW 5架构电路相对简单,增加数量也容易些,但是受限于工艺和晶体管规模,从HD 5870的1600个流处理器单元继续增加一倍进而生产下一代显卡也不可能了,而且流处理器数量越多,效率问题愈发严重,AMD必须要改革了。
在HD 6900系列显卡架构上,AMD就改进了VLIW 5架构,去掉了4D+1D中的1D单元,VLIW 5变成了VLIW 4,所以显卡的流处理器单元数量也不再是是5的整数倍,而是4的整数倍了。
HD 6900系列显卡上开始使用VLIW 4架构,每个ALU单元的功能有所增强 |
准确来说,VLIW 4架构中的4个ALU单元不是前面所说的那个4D单元,而是4个1D单元,功能更强了,都可以执行原本只有VLIW 5架构的那个1D超标量单元才能执行的特殊函数操作,所以流处理器单元数量虽然少了,实际上性能更强了。
据AMD称,VLIW 5架构的运算效率实际只有70%左右,VLIW 4可以提高到80%,同样的核心面积下能带来10%的性能提升,简化了指令调度和寄存器管理,提升了逻辑电路利用率。
VLIW 4只是VLIW 5架构的一小步改变,但是代价也是高昂的,5到4的减少意味着每组流处理器所需的发射端、分支预测以及寄存器单元都要增加四分之一,以HD 6970为例,其晶体管数量以及核心面积从HD 5870的21.5亿/334平方毫米增加到26.4亿/389平方毫米,而TDP功耗也从188W增加到250W,成本和售价升高了。
VLIW 4架构只在三款HD 6900显卡上使用,并没有推广到中低端市场来,这主要是市场竞争因素所致,因为AMD的显卡在功耗和发热上同比NVIDIA的Fermi家族显卡还是要好一些,性能、价格则是各有所长,AMD并不需要急着推新架构显卡,HD 5770换个名字照样卖的很好。
VLIW 4架构未能普及,但是它注定要成为过渡架构了,因为使用AMD下一代显卡架构Graphic Core Next(简称GCN)的显卡即将上市了,相比VLIW 5/4只有70-80%的效率,GCN抛弃了VLIW体系,运算效率接近100%,走的也是MIMD体系了。
游客 2019-01-24 12:10
该评论年代久远,荒废失修,暂不可见。
支持(2) | 反对(1) | 举报 | 回复
23#
游客 2017-06-11 14:31
支持(10) | 反对(0) | 举报 | 回复
22#
游客 2017-06-05 09:51
21#
游客 2012-11-26 07:41
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(0) | 反对(17) | 举报 | 回复
20#
游客 2012-11-26 02:46
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(1) | 反对(3) | 举报 | 回复
19#
超能网友终极杀人王 2012-01-09 00:21 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(0) | 反对(3) | 举报 | 回复
18#
超能网友终极杀人王 2011-12-30 13:49 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(0) | 反对(0) | 举报 | 回复
17#
游客 2011-12-29 11:28
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(0) | 反对(0) | 举报 | 回复
16#
游客 2011-12-29 11:28
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(0) | 反对(16) | 举报 | 回复
15#
超能网友学前班 2011-12-29 09:31 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(0) | 反对(0) | 举报 | 回复
14#
超能网友高中生 2011-12-29 06:26 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(9) | 反对(5) | 举报 | 回复
13#
游客 2011-12-25 12:38
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
12#
游客 2011-12-24 23:40
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
11#
游客 2011-12-24 19:37
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(0) | 反对(0) | 举报 | 回复
10#
游客 2011-12-24 01:54
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(1) | 反对(0) | 举报 | 回复
9#
游客 2011-12-24 01:54
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(0) | 反对(0) | 举报 | 回复
8#
游客 2011-12-23 21:23
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(0) | 反对(0) | 举报 | 回复
7#
我匿名了 2011-12-23 10:03
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(0) | 反对(0) | 举报 | 回复
6#
游客 2011-12-22 18:05
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(0) | 反对(0) | 举报 | 回复
5#
游客 2011-12-22 16:43
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(1) | 举报 | 回复
4#
超能网友管理员 2011-12-22 16:39 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(0) | 反对(15) | 举报 | 回复
3#
超能网友研究生 2011-12-22 16:26 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
2#
超能网友终极杀人王 2011-12-22 16:09 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
1#