本文约2034字,需3分钟阅读    在GPU通用计算刚刚进入桌面平台时,NVIDIA以及AMD都把视频转码加速功能当作重点,因为这几乎是GPU计算带给普通消费者最直接、最有感触的功能了,比如MediaCoder、BadaBoom、MediaEspresso等软件都支持NVIDIA的CUDA加速以及AMD的Stream加速。

  GPU转码加速的好处是速度快,但是画质也低了,无法与单纯的CPU转码相媲美,随着技术的进步,GPU转码的画质才慢慢提升上来。再往后Intel也加入战场,SNB架构的GPU部分增加了专用的Quick Sync单元,无论转码速度还是画质都要比A/N两家的GPU加速效果要好。

  AMD在最新一代的GCN架构中增加了专用的VCE(Video Encodec Enigine)引擎,支持1080P 60fps视频转码,而且支持完整的H.264规范(前一代转码只支持H.264 Baseline),唯一的问题是软件支持度不够好,发布5个多月了才有MediaEspresso支持。


AMD的VCE引擎

  Ivy Bridge处理器中,Intel也将转码单元Quick Sync做了升级,虽然Intel官方资料中并没有提及具体的变化,但是我们之前也做过测试,发现转码速度变快了。此外,IVB的Quick Sync也统一到了Media SDK API下。

  再有一个新选手就是NVIDIA的NVENC编码引擎了,它是Kepler架构新增的功能,按照NVIDIA给出的资料来看,NVENC比自家的CUDA编码还要优秀,因为它跟Quick Sync一样属于是专用的编码加速单元,而CUDA加速则是比较通用的,速度上不如专用单元快。


NVENC编码加速功能

  早前我们也打算把NVENC编码加速专门测试一下,只是一直没能成行,不过首发测试中也做了MediaEspresso转码加速测试,GTX 680转码一段视频需要32秒,GTX 580HD 7970分别需要40、45秒,也就是在GPU计算性能更差的情况下,GTX 680的转码速度依然要高于GTX 580、HD 7970,NVENC功不可没。

  法国Hardware.fr网站最近做了详细的NVENC编码加速测试,并与Intel Quick Sync做了对比,虽然没能对比AMD的VCE编码引擎(软件支持是AMD的软肋啊),但是本文的测试方法和结果依然值得推荐,特别是画质对比方面专业得多,小编受益匪浅啊。

测试软件及方法:


MediaEspresso也有bug和限制,比如GOP 固定限制,对比测试并非以其为主要手段

  讯连科技的MediaEspresso 6.5软件支持Quick Sync以及NVENC加速。CPU为Core i5-3570K(HD 4000显卡),主板为华硕P8Z77 Pro-V。对比的显卡主要是GTX 670、GTX 680、GTX 480,虽然GTX 480是上上代的显卡了,不过CUDA编码加速实际上对显卡要求并不高,即便是GTX 450与高端显卡的差距也非常小。

  另外,软件编码使用的是Build 2197版本的H.264,分别测试了1-pass和2-pass。

画质对比

  画质对比值得着重说一下。平时我们做画质对比主要是用肉眼看,这种方法虽然直观一些,但是误差太大,而且不同的截图差别也不一样,不够有说服力。

  Hardware.fr用的是PSNR和SSIM数值,PSNR(Peak signal-to-noise ratio,峰值信号噪点比例)是信号强度与噪点强度的比值,可以用来衡量有损压缩编码过程中的失真度。而SSIM(structural similarity index,结构相似指数)也是用来衡量两张图片之间的相似度。

  有兴趣的可以参考上面的维基百科解释研究一下,总之,PSNR和SSIM是科学的测量方法,要比肉眼查看可靠得多,说服力也足够强。

  上面就是几种编码方案的PSNR和SSIM结果。

  虽然速度更快,但是NVENC引擎的转码画质与CUDA转码是一样的,丝毫没有降低。

  上面的计算只是基于平均状况,并不是全部内容,再来看一下500张逐帧截图中的SSIM指数吧。

  这里只是一张图片,推荐去原文看对比,因为他们做的是网页特效,下面的六个选项是可以点击选中或者取消的,方便对比任意几种编码方案的结果,鼠标指上去还会显示各个方案的具体SSIM数值,这是单一截图展示不了的。

  由于软件的Bug和限制,N卡和Quick Sync转码的截图中每隔30帧就会出现一次剧烈波动(场景太复杂),0到187帧之间的场景容易压缩,因此SSIM比较稳定,188到243帧以及244到350帧之间波动就非常大,SSIM指下降的厉害。

  虽然Quick Sync在复杂场景中SSIM有所下降,但是依然要领先与NVIDIA显卡,H.264 1-pass编码依然有明显优势。

  那么实际画质是如何呢?来看一下317张截图的真实截图对比吧。

  这里依然去原文查看,因为他们作出了动态效果,最下面是各种编码方案的画质选择,点击左侧部分,转码后的截图就会出现在网页左边,右边则是另一种方案的画质截图,比如上图中我选择了原图与GTX 670(NVENC)编码,效果就是这个样子。

(ps,这里有点瑕疵,出现了两个GTX 670选项,实际上应该是一个GTX 670和一个GTX 680)

  结果是:NVIDIA GPU加速编码的画质损失依然是最严重的,而最新的H.264编码做的比较好,特别是2-pass画质十分接近原始画质。

转码速度及功耗

  使用的影片是720P分辨率的《阿凡达》,结果如下:

(说下表格的数据,第一列是转码时间,之后是待机功耗,第三列是转码时的功耗,最后一列是功耗差值)

  来看NVENC,其转码速度明显优于GTX 480,性能高了133%之多。功耗方面,固定转码单元的GTX 680比GTX 480只低了21W,从差值上看也只有11W,并没有表现出比预期更明显的优势。

  总的来看,Quick Sync依然是最好的编码加速方案,功耗和转码性能上都排名第一。另外,H.264 1-pass编码速度要比CPU还快,画质也高一些,而2-pass编码的速度不出意外地倒数第一,但是画质上傲视群雄。

  如果以W(功耗)/H(时间,小时)为基础来看(转码功耗乘以时间(s)再除以3600,上图中的法文符号","在英文中是".",也就是说上图中的数值是6.87、8.95这样的小数而非整数),Quick Sync转码每小时消耗了0.83W电力,而GTX 670、GTX 680消耗的电力在3.10、3.24左右,其他方案消耗的就更高了,GTX 480效费比最差。

总结:

  原文的总结有三段,其实意思可以归纳为三句话:

  无论转码速度还是转码效率,Quick Sync依然是最佳的方案,NVIDIA的NVENC要胜过前代的CUDA方案,但还是比不过Intel。

  H.264软件转码中1-pass速度要超过CPU转码,2-pass虽然速度最慢,但是画质是最好的,适合对画质有较高要求的场合。

  至于AMD,技术上是好的,软件支持是杯具的。

 


  • 游客  2018-08-06 22:18

    I'm just writing to let you know of the helpful encounter my princess found using yuor web
    blog. She picked up lots of pieces, most notably what it's like to possess an incredible teaching mood
    to get a number of people without difficulty have
    an understanding of certain impossible topics.
    You undoubtedly surpassed our own expectations. Thank you for showing such helpful, trustworthy, explanatory and in addition easy guidance on that topic to Lizeth.

    支持(0)  |   反对(0)  |   举报  |   回复

    40#

  • 游客  2016-09-10 01:51

    Hello!

    支持(0)  |   反对(0)  |   举报  |   回复

    39#

  • 游客  2016-09-08 14:17

    Very nice site!

    支持(0)  |   反对(0)  |   举报  |   回复

    38#

  • 游客  2016-09-07 08:02

    Very nice site!

    支持(1)  |   反对(0)  |   举报  |   回复

    34#

  • 游客  2016-09-06 01:41

    Very nice site!

    支持(0)  |   反对(0)  |   举报  |   回复

    30#

  • 游客  2016-09-03 06:36

    Very nice site!

    支持(0)  |   反对(0)  |   举报  |   回复

    24#

  • 游客  2016-09-02 00:22

    Very nice site!

    支持(0)  |   反对(0)  |   举报  |   回复

    20#

  • 游客  2016-09-01 07:39

    Good day! Do you know if they make any plugins to safeguard against hackers? I'm kinda paranoid about losing everything I've worked hard on. Any recommendations? beagcgdkfgfkefde

    支持(1)  |   反对(0)  |   举报  |   回复

    16#

  • 游客  2015-02-25 09:37

    游客:
    网友 [Guest] 的原贴:1楼
    至于AMD,技术上是好的,软件支持是杯具的。
    从头到尾都没有AMD的测试,怎得出AMD技术上是好的结论?
    http://news.mydrivers.com/1/228/228865.htm
    但是只能小部分发挥。所以说技术上是好的,支持是悲剧的

    支持(0)  |   反对(0)  |   举报  |   回复

    15#

  • 游客  2012-05-28 12:35

    网友 [Guest] 的原贴:1楼
    至于AMD,技术上是好的,软件支持是杯具的。 从头到尾都没有AMD的测试,怎得出AMD技术上是好的结论?
    http://news.mydrivers.com/1/228/228865.htm

    支持(0)  |   反对(0)  |   举报  |   回复

    14#

  • 游客  2012-05-28 12:30

    至于AMD,技术上是好的,软件支持是杯具的。 从头到尾都没有AMD的测试,怎得出AMD技术上是好的结论?

    支持(0)  |   反对(1)  |   举报  |   回复

    13#

  • 游客  2012-05-27 19:51

    但是Quick Sync转出来的H264影片在平板电脑上(TF101)播放卡顿,虽然开了硬解码,而CPU或CUDA转出来的H264片子播放正常。

    支持(0)  |   反对(0)  |   举报  |   回复

    12#

  • 游客  2012-05-27 17:28

    网友 [Guest] 的原贴:1楼
    傻逼小便你丫实际用过AMD和nVidia两家的转码么!?整个把二者的优劣掉了个个儿、媒体编辑放话是要负责任的!!!
    你别到处喷粪

    已有6次举报

    支持(0)  |   反对(0)  |   举报  |   回复

    11#

  • 游客  2012-05-27 14:08

    无论转码速度还是画质都要比A/N两家的GPU加速效果要好。 之前expreview不是有对比了吗 还这么说 除了速度一无所有

    支持(0)  |   反对(0)  |   举报  |   回复

    10#

  • 游客  2012-05-27 09:23

    傻逼小便你丫实际用过AMD和nVidia两家的转码么!?整个把二者的优劣掉了个个儿、媒体编辑放话是要负责任的!!!

    已有7次举报

    支持(0)  |   反对(0)  |   举报  |   回复

    9#

  • 游客  2012-05-27 00:56

    QSV后发制人,碉堡

    支持(0)  |   反对(0)  |   举报  |   回复

    8#

  • 游客  2012-05-26 17:42

    用的是x264吧 这已经是业界标杆了

    支持(0)  |   反对(0)  |   举报  |   回复

    7#

  • 游客  2012-05-26 13:58

    http://news.mydrivers.com/1/228/228865.htm

    支持(0)  |   反对(0)  |   举报  |   回复

    6#

  • 游客  2012-05-26 13:43

    2pass还能和CPU比啊 CPU 2pass 差距还是没法比

    支持(0)  |   反对(0)  |   举报  |   回复

    5#

  • bolvar终极杀人王 2012-05-26 13:29

    网友 [Guest] 的原贴:1楼
    CPU和H264 1-PASS啥区别? CPU不是用H264编码器?
    网友 [bolvar] 的原贴:2楼
    这个我也想知道,读了全文也没发现说纯CPU转码是用的什么软件或者怎么实现的。
    自己都问傻了,这个CPU加速应该是MediaEspresso软件中的,不使用任何GPU加速就是默认使用CPU。

    支持(0)  |   反对(0)  |   举报  |   回复

    4#

加载更多评论

我来评论

热门文章
1Zen 2架构锐龙3000系列已全部上架,锐龙7 3800X就是个特挑的锐龙7 3700X
2酷冷至尊MasterCase H100机箱评测:不止小巧个性,更有不俗扩展
3罗技无线接收器再现漏洞,攻击者可轻易通过其控制他人电脑
4模拟游戏机神器RetroArch将登陆Steam,免费下载但不是人人都适用
5TechPowerUp测PCIe 4.0 SSD:整体性能比PCIe 3.0提升不超过1%
6每日超值推荐:闪迪至尊版500G史低659元,雷蛇黑寡妇绿轴RGB机械键盘499元
7FCC认证委员会通过高通两款802.11ay的芯片组认证:我们离60GHz Wi-Fi还远吗?
8高通发布骁龙855 Plus平台:主频、GPU加强,ROG Phone 2首发
9还在为保修发愁么?耕升上线三年质保,支持个人送保