§1.3 改进的内存操作子系统
·可配置的L1和统一的L2并行数据缓存技术
透过成千上万的GPU Computing应用程序,我们发现Shared Memory(共享内存)不能解决所有问题,一些程序需要Shared Memory,另一些程序可能需要cache,还有的既需要Shared Memory也需要cache。针对这样的应用需求,Fermi在内存体系上作了重要改进,优化的内存设计可以提供Shared Memory也能提供cache,程序员能根据自己的需求来做选择。
![]() |
在前面我们已谈到,Fermi架构内的每个SM的RAM达到64KB,可以被配置成48KB的Shared Memory和16KB的L1 cache,或者配置成为16KB的Shared Memory和48KB的L1 cache。这样的配置可以最大限度的满足应用程序的不同需求。
同时,应用程序都能因寄存器溢出而从L1 cache得到好处,在之前类似的情况,都会从片外的内存去访问数据,大大增加延迟导致性能下降。
Fermi还新增配备有768KB大小统一的L2 cache,可以支持所有的存取(LD/ST)和纹理请求,为它们提供有效和高速的数据支持。有些算法不能在运行前就确定下来,像一些物理问题、光线跟踪和稀疏矩阵乘法等,尤其需要缓存的支持。当过滤器和转换器需要所有的SM都去读取相同数据的时候,缓存一样会有很大的帮助。
• 首个提供ECC内存支持的GPU
Fermi是首个支持ECC(Error Correcting Code)的GPU,正常情况下的内存位存储错误,都会引起软件的错误,ECC就是用来检查和纠正这样的错误。由于这样的错误会根据系统的增大线性的增加,越是高性能的计算ECC就显得越重要。
普通用户对ECC或许没有什么概念,但是在商业计算上ECC却是不可或缺的功能,GT200虽然实现了双精度浮点运算,但是并没有支持ECC,像使用GT200的Tesla 10系列就只适合做小规模的集群,要想真正冲击高性能计算机(HPC)领域那么只能是Fermi架构的服务器。
Fermi的寄存器、共享内存、L1缓存、L2缓存和DRAM内存都受到ECC保护,这样的设计大大增加系统的可靠性,在HPC领域Fermi将能大展身手。
• 原子内存操作性能极大增强
所谓原子操作(Atomic operations)是指像add、min、max、compare-and-swap这些操作在读、改和写的过程中不会被其它线程中断。原子内存操作在并行计算中非常重要,并发线程允许正确地在共享数据结构上实现“读-改-写”操作。
原子内存操作广泛用于并行排序、归约操作和没有锁定线程时的建立并行筑数据结构。更多的原子单元和L2缓存的加入,使得Fermi的原子操作性能相比GT200提升了20倍以上。
游客 2012-08-09 02:54
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
48#
游客 2010-04-15 21:17
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
47#
游客 2010-04-05 12:58
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
46#
游客 2010-03-31 10:50
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(1) | 举报 | 回复
45#
超能网友管理员 2010-03-31 09:16 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(1) | 举报 | 回复
44#
游客 2010-03-30 20:15
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(1) | 举报 | 回复
43#
游客 2010-03-29 23:44
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
42#
游客 2010-03-29 15:30
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
41#
游客 2010-03-29 14:49
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
40#
游客 2010-03-29 13:03
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
39#
超能网友一代宗师 2010-03-29 11:03 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
38#
游客 2010-03-28 22:12
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
37#
超能网友大学生 2010-03-28 19:39 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
36#
超能网友教授 2010-03-28 13:51 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
35#
游客 2010-03-28 13:29
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
34#
游客 2010-03-28 12:28
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
33#
游客 2010-03-28 10:35
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
32#
游客 2010-03-27 14:52
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
31#
超能网友管理员 2010-03-27 14:26 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
30#
超能网友初中生 2010-03-27 14:18 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
29#
游客 2010-03-27 14:03
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
28#
游客 2010-03-27 13:57
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
27#
超能网友教授 2010-03-27 13:39 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
26#
游客 2010-03-27 13:11
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
25#
游客 2010-03-27 12:47
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
24#
游客 2010-03-27 12:43
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
23#
游客 2010-03-27 12:15
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
22#
游客 2010-03-27 12:13
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
21#
游客 2010-03-27 11:36
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
20#
游客 2010-03-27 11:30
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
19#
加载更多评论