CUDA、量子物理、视频引擎----G80的通用计算架构
当前GPU架构的通用计算潜力
GPU通用计算(GPGPU)扩展,在NV30时代就曾被提起。CPU由于主要针对复杂控制和低延迟环境设计,而使得它的运算单元偏少,带宽也不足。相比之下,GPU本身就是一个SIMD(单指令多数据流)的“流处理器”,拥有众多的运算单元和强悍的外部存储器带宽,更加适于高并行性、高密集度的计算。随着GPU本身可编程特性和灵活度方面的改善和越发强大的浮点处理,越来越多的人开始用GPU做一些非绘制方面的事。另外,Cg、HLSL以及GLSL等实时的高级绘制语言的出现和发展也对改善GPU通用计算的编程环境起到了推波助澜的作用。
ATi R5XX系列发布后,因为它宽松的编程环境,这个词语更多的出现在各大媒体的报道中。GPU的通用计算,从长远来看是GPU功能扩展的另一个要点,也是下一轮GPU竞赛热点功能。现在,挟DX10余威的G80又能在通用计算领域又将代来一次飞跃。统一渲染流水线架构、多达上千个线程的高平行度流水线、32位精度的无损浮点象素混合、强化的Render Target多目标输出、几乎无损的动态分支和循环shader操作、整数指令集的支持...这一切都为它的通用计算能力打下了良好的基础,让我们来看看G80目前已经列在纸上的通用计算技术有哪些。
□-Quantum(量子)物理加速技术

由于游戏的发展,游戏引擎中的物理效果已经越来越引起开发商和玩家的兴趣。能在一个拥有真实物理效果的游戏场景里驰骋肯定是每个玩家的愿望。目前游戏里的物理运算一般都由CPU负责,但物理运算所消耗的大量浮点处理能力并不适合于CPU,将它从游戏里剥离出来已经是大势之趋。NV这次又占得先机,为G80图形核心引入了名为“Quantum”的GPGPU(GPU通用化计算)物理加速技术。G80图形核心将会是业内第一个支持3D图形和视频处理以外功能的GPU。
基于SLI架构的物理渲染流程
□-CUDA通用计算架构

G80的多线程通用计算管线构成
CUDA是Compute Unified Device Architecture的缩写,直译就是通用计算架构。CUDA是一项新的基础计算体系,它不但支持图形芯片模拟物理计算,也加入了GPU的首个C编译开发环境。
实际上,CUDA提供了一个基于C语言的底层函数库, 可以直接使用一些D3D或者OpenGL不包含的特性。这项技术能让GPU的芯片核心同步协调地进行通用计算,速度比传统方式大有提升。另一方面,首个面向GPU的C编译开发环境让开发者拥有了新的解决方案,一些复杂的计算例如产品设计、数据分析、技术处理、游戏物理应用等方面现在都是游刃有余。
GeForce 8800目前已经应用到这项技术,NVIDIA未来的Quadro专业图形解决方案也会随之而来,CUDA打破了传统的GPU处理数据方式的局限性,让GPU的核心能联合、同步地共享数据。

G80基于并发多线程的通用计算
□-高清硬件支持

至于影像输出方面,G80 亦由上代的 8-Bit输出提升至10-Bit 影像输出,令画面色彩更为丰富及逼真。 GeForce 8800 家族全线产品将支持 HDCP(High-bandwidth Digital Content Protection),此外,G80还会支持新一代 PureVideo HD 技术,并将首次支持HD Noise Reduction(高清影讯除噪声)及HD edge enhancement( 高清影讯边缘强化) 。难怪在HQV高清影像测试中,拿下现今独立图形卡最高分。
对于北桥散热器,要重点考察的是散热能力和人性化设计两方面,人性化设计包括外型、安装难易、兼容性、噪音水平等,综合散热能力、价格、人性化设计,作为此次评测的最终目的……
