§2.4 并行几何处理
过去的GPU都使用了单一的前端功能设计,如fetch、assemble和rasterize等,固定的流水线只能为那些灵活的并行处理核心提供固定的性能,这样很容易造成这些功能单元成为瓶颈或资源浪费。
虽然单一的前端设计在过去的GPU中有过辉煌历史,但随着几何复杂性的增加,单一的前端设计成为主要障碍,尤其是Tessellation的应用从根本上打破了GPU图形工作量的平衡,Tessellation中的三角形密度呈几何倍数增长,对流水线的优化成为最迫切的要求。
有鉴于此,GF100图形架构最重要的改进在于将原来的单一前端设计改变为并行几何处理,包括并行化的光栅引擎和多形体引擎,它们将会带来突破性的性能飞跃,相比于GT200,GF100的几何性能增长8倍以上。
·多形体引擎(PolyMorph Engine)
多形体引擎(PolyMorph Engine)负责Vertex Fetch(顶点拾取)、Tessellation(曲面细分)、Viewport Transform(视口变换)、Attribute Setup(属性设定)和Stream Output(流式输出)五个阶段运算,每个阶段的计算结果都会被传递给SM,SM执行游戏着色器,然后将结果返回给多形体引擎的下一个阶段,当所有运算完成后,结果将会送至光栅引擎。
第一个阶段,从全局的顶点缓冲区获取顶点并送给SM进行顶点和外壳(Hull)着色,此时顶点的物理空间转变为世界空间,而Tessellation要求的参数也得以计算。
第二个阶段,多形体引擎得到Tessellation参数,Tessellator开始进行曲面细分并输出对应的顶点,这些新的顶点被送至SM的Domain着色器和Geometry着色器。Domain着色器以从Hull着色器和Tessellator得到的信息为基础,对顶点的最终位置进行计算,在这个阶段, 贴图置换(Displacement map)通常会为了增加细节特征而得以应用。
而Geometry着色器管理着后处理,对需要的顶点和基本体进行删减或添加,这个结果最终将送回到多形体引擎。
第三个阶段,多形体引擎执行Viewport Transformation(视口变换)和透视修正,接下来是Attribute setup(属性设定),把后期视口变换顶点自属性转换成平面方程,以进行高效的着色器评估,最后顶点被随意地“stream out”(流输出)到内存,以便能作其它的处理。
每个SM内包含有一个多形体引擎,完整的GF100一共拥有16个多形体引擎,在作Tessellation处理时,16个引擎以相当于并行的方式工作,相比与对手RV870的单一Tessellator固定单元,GF100在这方面的性能将具有明显优势。
·光栅引擎(Raster Engine)
在经由多形体引擎处理之后,运算结果被送至光栅引擎(Raster Engine),为了提高三角形吞吐量,GF100使用了四个光栅引擎并行处理。
光栅引擎由Edge Setup(边缘设置)、Rasterizer(光栅器)和Z-Cull(Z剔除)三步组成。在Edge Setup阶段,顶点位置被拾取,三角表边缘被处理,那些不需要在屏幕上显示的三角形将被消隐掉。每个Edge setup单元在每个周期可以处理一个点、线或三角形。
Rasterizer为每个基元运行边缘方程计算像素的覆盖,如果使用了抗锯齿功能,则为每个多采样和覆盖采样进行覆盖操作。每个Rasterizer在每个周期可以输出8个像素,因此4个光栅引擎每周期一共可以输出32个光栅化的像素。
光栅化后的像素进入Z-Cull单元,Z-Cull单元获取像素图块,并将图块中像素的颜色深度与显存中的现有像素进行比较,那些完全处理显存像素之后的像素图块将从流水线中剔除掉,不需要进一步的像素着色工作,从而提高工作效率。
游客 2012-08-09 02:54
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
48#
游客 2010-04-15 21:17
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
47#
游客 2010-04-05 12:58
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
46#
游客 2010-03-31 10:50
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(1) | 举报 | 回复
45#
超能网友管理员 2010-03-31 09:16 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(1) | 举报 | 回复
44#
游客 2010-03-30 20:15
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(1) | 举报 | 回复
43#
游客 2010-03-29 23:44
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
42#
游客 2010-03-29 15:30
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
41#
游客 2010-03-29 14:49
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
40#
游客 2010-03-29 13:03
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
39#
超能网友一代宗师 2010-03-29 11:03 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
38#
游客 2010-03-28 22:12
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
37#
超能网友大学生 2010-03-28 19:39 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
36#
超能网友教授 2010-03-28 13:51 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
35#
游客 2010-03-28 13:29
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
34#
游客 2010-03-28 12:28
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
33#
游客 2010-03-28 10:35
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
32#
游客 2010-03-27 14:52
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
31#
超能网友管理员 2010-03-27 14:26 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
30#
超能网友初中生 2010-03-27 14:18 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
29#
游客 2010-03-27 14:03
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
28#
游客 2010-03-27 13:57
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
27#
超能网友教授 2010-03-27 13:39 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
26#
游客 2010-03-27 13:11
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
25#
游客 2010-03-27 12:47
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
24#
游客 2010-03-27 12:43
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
23#
游客 2010-03-27 12:15
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
22#
游客 2010-03-27 12:13
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
21#
游客 2010-03-27 11:36
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
20#
游客 2010-03-27 11:30
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
19#
加载更多评论