§2.5 第三代Streaming Multiprocessor流处理器群
关于SM的架构在第一章也作了详细说明,这里仅对它在图形方面的特性作些补充。
![]() |
每个SM中包含有32个CUDA Core、16个Load/Store单元、4个SFU单元、1个多形体引擎、64kb可配置的共享内存/L1缓存,以及两个Warp调度器和指令发送器。
·增强的纹理性能
每个SM里还配置有4个纹理单元(Texture Unit),每个纹理单元在一个周期内能完成一个纹理地址计算并获取四个纹理采样,返回的结果是可以过滤的,也可以是没有过滤的,它支持双线性、三线性和各向异性过滤。
GF100通过提升效率来提升纹理性能,这主要是通过将纹理单元移至SM内来实现,它提升了纹理缓存的效率,同时纹理单元和纹理缓存的工作频率也更高。
![]() |
在上代的GT200架构,每三个SM(一个TPC)共享一个包含有8个纹理过滤单元的纹理引擎,一共有80个纹理单元,在GF100架构中,虽然纹理单元减少到了64个(4*16),但每个SM都有自己独立的纹理单元和独立的纹理缓存,这种整合的方式使得其性能直线增长。比如在Crysis游戏中,GF100的纹理性能是GT200的170%。
同时,在实际应用中它会带来积极的作用,比如阴影绘图和SSAO(Screen Space Ambient Occlusion,屏幕环境光遮蔽)方面。
GF100的专用L1纹理缓存(12KB)也作了重新设计,可以实现更高的效率,而且,通过统一的L2缓存(768KB),纹理可用的缓存容量达到GT200的三倍,为纹理密集的着色器提升了命中率。
另外,在上一代架构中,纹理单元的频率与核心频率相同,但在GF100中,纹理单元的工作频率更高,因此对性能的提升是显而易见的。
GF100的纹理单元还支持DirectX 11的BC6H和BC7压缩格式,在HDR纹理或渲染目标时可以减少内存占用量。
·从硬件上实现抖动采样(jittered sampling)
抖动采样(jittered sampling)是针对阴影边缘和后期处理一项技术,通过对邻近texel(纹理像素)进行采样来计算并创建更柔和的阴影边缘效果。借助于DirectX 11的four-offset Gather4特性,GF100的纹理单元支持抖动采样,允许通过一条纹理指令从64x64的像素网格中拾取4个texel。
不同的是,GF100从硬件上实现了DirectX 11的four-offset Gather4,能大大加速阴影绘图、环境光遮蔽和后处理算法,有了抖动采样的帮助,游戏能提高柔和阴影(soft shadow)或纹理过滤效率。对游戏开发商来说,意味着消耗的硬件资源更少;对玩家来说,则意味着画质更好。
在上图左边显示的是3DMark 2006中的柔和阴影图样,它是通过右边的纹理网格执行抖动采样来完成的。GF100从硬件上实现抖动采样,性能较之以前提升了2倍。
游客 2012-08-09 02:54
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
48#
游客 2010-04-15 21:17
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
47#
游客 2010-04-05 12:58
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
46#
游客 2010-03-31 10:50
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(1) | 举报 | 回复
45#
超能网友管理员 2010-03-31 09:16 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(1) | 举报 | 回复
44#
游客 2010-03-30 20:15
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(1) | 举报 | 回复
43#
游客 2010-03-29 23:44
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
42#
游客 2010-03-29 15:30
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
41#
游客 2010-03-29 14:49
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
40#
游客 2010-03-29 13:03
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
39#
超能网友一代宗师 2010-03-29 11:03 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
38#
游客 2010-03-28 22:12
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
37#
超能网友大学生 2010-03-28 19:39 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
36#
超能网友教授 2010-03-28 13:51 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
35#
游客 2010-03-28 13:29
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
34#
游客 2010-03-28 12:28
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
33#
游客 2010-03-28 10:35
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
32#
游客 2010-03-27 14:52
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
31#
超能网友管理员 2010-03-27 14:26 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
30#
超能网友初中生 2010-03-27 14:18 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
29#
游客 2010-03-27 14:03
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
28#
游客 2010-03-27 13:57
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
27#
超能网友教授 2010-03-27 13:39 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
26#
游客 2010-03-27 13:11
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
25#
游客 2010-03-27 12:47
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
24#
游客 2010-03-27 12:43
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
23#
游客 2010-03-27 12:15
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
22#
游客 2010-03-27 12:13
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
21#
游客 2010-03-27 11:36
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
20#
游客 2010-03-27 11:30
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
19#
加载更多评论