E X P

  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

      AMD Radeon HD 7900系列本次一个较大的改进方面就是对应用程序的硬件加速,在这方面AMD以前是一直处于劣势的,自己首先提出来的GPU通用计算却在NVIDIA CUDA的手上发扬光大,虽然之后推出了Stream通用计算技术想挽回局面,但是市场占有率还是一直不如CUDA。

      本次HD 7900系列核心的GCN架构在通用计算方面下了很大的功夫,GPU的可编程能力和运算都得到了加强,GCN架构支持C、C++以及其他高级编程语言,这样对软件工程师来说编程会更加方便,可以赢得更多软件厂商的亲睐,让更多的应用程序支持AMD显卡的加速技术。

      Radeon HD 7900系列上的APP加速主要包括三个方面:专用的硬件高清视频加速器、增强的计算硬件和软件、基于AMD APP SDK开发包的应用程序生态系统。

    视频的解码、编码

      HD 7900系列的UVD引擎其实和HD 6800/6900系列的UVD3差不多,但是不代表没有改变,HD 7900在原来双流HD+SD视频的基础上增加了对双流HD+HD(就是蓝光光盘的画中画)的视频解码的支持。关于支持硬解的视频格式,MPEG-4/DivX格式的视频经我们测试已经可以Windows Media Player 12顺利的硬解,用PowerDVD 11的话反而不能。另外我们还测试过DivX5格式的视频,此格式的视频两个播放器都还是由CPU软解的。

      在视频编码方面,AMD推出了全新的VCE(Video Codec Engine)引擎,这个引擎类似于Intel HD Graphics 2000/3000的Quick Sync技术,让视频的编码变得更有效率。

      VCE的核心功能是以个多流硬件H.264高清视频编码器,其编码速度比1080P@60fps的播放速度更高,分为VCE完全编码和混沌编码两种模式。支持4:2:0的色彩取样,并可针对视频和游戏的场景变化作出优化,压缩质量可调,支持多轨的音频、视频。

      VCE引擎的独立和混合模式,高端显卡建议开启混合模式,使用OpenCL对运动估算(Motion Estimation)/帧内预测(Intra Prediction)/正向变换(Forward Transform)进行计算而用VCE引擎进行熵编码 (Entropy Encode),这样比单纯使用VCE引擎编码更有效率。而低端显卡上则建议用VCE引擎进行独立编码,这样与CPU编码相比功耗更低。


    VCE完全编码模式


    混合编码模式

      遗憾的是现在的视频处理软件还不支持AMD的VCE编码,还有待各款软件更新支持,但是单纯使用Stream加速的话还是可以看得出两代显卡的硬件加速效率差别的。

      我们就尝试过用CyberLink MediaEspersso对HD 7970和HD 6970在视频压缩方面的硬件加速效率进行对比,测试平台用的是默认3.3GHz的Core-i5 2500K,4GB DDR3-1333内存。

      原文件是一个一个12分48秒的TS视频,文件分辨率为1920x1080,1.84GB大小,视频为MEPG-2格式,码率20000Kbps,29.97fps,音频为MEPG-1格式,48000Hz采样率,码率为384kbps。输出文件是720P的MP4,视频编码为H.264,码率2000Kbps,帧率24fps,音频格式ACC,采样率44100,码率为128Kbps。

    Espresso_7970_b.jpg" target="_blank">
    使用HD 7970加速,压缩视频耗时3分32秒


    使用HD 6970加速,压缩视频耗时4分47秒

      用HD 7970的话压缩时间比HD 6970快了1分15秒,足足快了26%之多,我们可以看到HD 7970在压缩视频时是以925/1375MHz的频率全速运作的,而HD 6970则是运作在500/1375MHz的频率,并没有全速工作,换卡后我们并没有对软件的设置做任何的修改。可见即使没有VCE的加速单纯用Stream的情况下,HD 7970在压缩视频方面还是比HD 6970效率要高的。

    Steady Video 2.0技术

      Steady Video是与Llano APU共同面世的视频稳定技术,基于AMD APP加速技术开发,可消除视频中的抖动。

      新的Steady Video 2.0增加了对隔行扫描视频的支持、支持指标覆盖、支持并行演示模式,并增强了算法的有效性。

      Steady Video 2.0借助QSAD指令可以提供10倍于CPU运动估计的速度,允许更多的复杂出来,带来更精良的画质,可以在任何可能的方向上侦查出+/-32像素的随机位移,每秒可以进行超过5130亿次的计算,可以保证所有处理都在几毫秒之内完成,可保持实时播放。


    AMD Steady Video的工作方式

      利用统计数据决定镜头移动的模型,测量每一帧之间的离散变化,合成出一条更平滑的移动路径,对每一帧都进行平移、旋转、缩放等操作,使之逐一趋近于平滑路径,最终实现稳定效果。

    在我们身边的AMD APP加速

      上面说的都是关于视频的解码和处理方面的应用,许多用户其实并不怎么关心这一方面,下面我们来说一下平常接触得更多的应用。


    将会有更多的常用程序支持AMD APP加速

      一般人一天中用得最多的软件应该就是浏览器了,现在的浏览器很多都加入了显卡硬件加速功能,大家在上网的时候可以打开GPU-Z其实可以看到其实是GPU有轻微的负载,在你不知不觉之间其实就用了GPU的APP加速功能。

      其实在浏览视频网站时显卡硬件加速效果是最明显的,Adobe在Flash Player 10.1之中就加入了GPU硬件加速视频功能,可以用GPU硬解网上的流媒体。


    Google Earth也支持OpenCL加速

      这些日常应用想要量化来进行对比测试是比较困难的,在经过一翻研究之下决定使用IE9浏览器访问性能测试页面“FishBowl Benchmark”,用此测试页面来对比HD 7970与HD 6970对浏览器的硬件加速能力,测试会将页面鱼的数量开至2000。


    用HD 7970的话页面有32fps


    用HD 6970的话页面有30fps

      虽然两者差距只有2帧,但是依然可以说明7970在APP加速方面比前一代显卡做得更好,相信驱动更加完善之后HD 7970会在APP加速方面做得更好。

      会有更多软件支持AMD APP加速

      就目前的情况来说,支持NVIDIA CUDA加速的软件不少但是支持AMD APP加速的真的屈指可数,不过相信在HD 7900系列推出后会有所好转,下面就是AMD在文档中所提到的两款新版软件可以支持AMD APP加速。

      TotalMedia Theatre 5.2播放器,这是一款为个人电脑设计的全能高清播放器。无论是播放本地计算机上的蓝光光盘、DVD、AVCHD和高清视频,还是播放UPnP服务器上的网络视频或Internet上的在线视频,它都能得心应手。

      即将到来的5.2版本更新软件将会对AMD Radeon HD显卡进行优化,支持MVC H/W硬件加速,支持UVD的MEPG-4 ASP硬件加速并用AMD APP SDK重写OpenCL SimHD。

      WinZip这款软件就不用多作介绍了吧,即将到来的16.5版本中开发公司于AMD合作,使用OpenCL对WinZip的压缩、解压、AES加密进行硬件加速,并对AMD Fusion APU和Radeon进行了优化,包括Fusion APU上的内存快速访问、支持显卡的大规模并行运算操作、OpenCL的工作量可以让CPU、集成显卡和独立显卡上平均分摊。

      WinZip现在还没有更新16.5版本,体验不到使用显卡加速后的压缩软件究竟可以快多少稍微有点遗憾,不过从AMD所提供的官方测试数据中我们还是对其充满信心的。

    全文小结

      HD 7900系列所用的GCN架构在通用计算方面的确做了不少改进,支持C、C++等高等语言就是以个很大的飞跃,软件工程师们会更乐意使用AMD APP SDK来编写程序,让更多的软件支持AMD APP加速。全新的VCE视频编码引擎可以让视频处理变得更加快捷,Steady Video 2.0带来更为强大的消除视频抗抖动能力,而UVD解码引擎也变得更为完美。

      从官方的文档中可以看出AMD这次是打算大力推自己的APP加速的,希望在并行计算上优化过GCN架构会带领AMD APP打一场翻身仗,毕竟现在NVIDIA CUDA在通用计算领域的影响力还是非常大的,AMD推广APP加速的道路上布满荆棘,能不能推广出去就要看AMD给不给力了。

    ×
    热门文章
    1华为 P70系列上架官方商城:全系搭载超聚光影像系统,5499元起售
    2西风 RTX 4080 VK联名版一体式水冷显卡上架:240水冷散热,售价8099元
    3《对马岛之魂 : 导演剪辑版》PC配置要求公布:4K@60FPS需要RTX 4080
    4《恶意不息》PC配置要求公布:1080P@60FPS需要RTX 3070TI
    5《家园3》PC版将降低配置要求,并公布了首年更新计划
    6ROG MAXIMUS Z790 HERO BTF背插主板图赏:旗舰美感再进化
    7AMD减少RDNA 2架构GPU供应:高端RX 6800/6900系显卡列进入最后阶段
    8Delta游戏机模拟器合集登陆App Store,用iPhone可玩GBA、NDS
    92024年3月中国大陆主板出货量:各个品牌厂商涨幅明显,华硕绝对优势
    已有 6 条评论,共 6 人参与。
    登录快速注册 后发表评论
    • 游客  2012-09-27 16:10

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      6#

    • 超能网友一代宗师 2012-01-09 17:56    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 超能网友编辑 2012-01-09 16:07    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      4#

    • 游客  2012-01-09 14:47

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      3#

    • 游客  2012-01-09 14:38

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • 超能网友终极杀人王 2012-01-09 14:16    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明