E X P
正努力加载中…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

      GPGPU通用计算发展的现在早已过了萌芽期,新一代TOP500超级计算机状元“Titan”使用的就是NVIDIA的Tesla K20加速卡作为运算主力。专业领域离消费者很远,而我们之前做过的测试也显示GPU通用计算也能在图像处理、视频编码这样的日常应用中给消费者带来性能提升。


    GPU编程性能确实有提高,但是没有这么神奇

      如今的显卡一年半左右升级一次,Tesla K20相比上一代Fermi有三倍双精度浮点性能提升,使用GPU加速的代码也有100或者200倍的性能提升,NVIDIA以及AMD展示的代码已经证明了这一前景,不过理念是好的,但是GPU加速真的有这么强大的加速效果吗?

      NVIDIA Tesla事业部总监Sumit Gupta在接受INQ采访时称GPU带来的上百倍性能提升是被现实中未优化的代码打败了。他说:“我们见到的100倍、200倍甚至更高的代码性能提升主要来自大学,NVIDIA已经跟许多大学合作,展示了GPU加速代码有100倍的性能提升。”

      “他们主要来自学术研究机构,如果你仔细看一下为什么这些代码有100倍的性能提升,你就会发现主要原因是他们编写的CPU代码太烂,因为他们中很多并不是专业的计算机科学家,而是生物学家、化学家以及物理学家,他们写的C代码对CPU来说也不够好,所以他们发现在GPU上使用CUDA或者CUDA Fortran编程要比在多核CPU上使用MPI或者多线程编程要容易的多。”

      按照Gupta的说法,其实很多人在GPU编程环境下获得上百倍或更高的代码性能提升的原因并不是GPU编程性能太强大了,而是因为原始的代码太烂,对多核CPU支持都不够好,所以一旦用在了超多核心的GPU上性能就会大幅提升。

      Gupta称在HPC领域中如果代码对多核CPU优化的足够好,那么在GPU加速环境中代码性能提升也就只有5-10倍了,有些情况下还会更少,甚至只有2倍。不过2倍代码加速也很不错了,因为这样的情况下CPU优化已经没有空间了。

      NVIDIA早前在宣传GPGPU通用计算时曾经举过例子,PPT上展示的通常都是使用GPU编程性能可以提升数百倍,令人兴奋不已。如今他们自己也公布实情了,这样的情况通常是因为原始的代码对多核优化不足,连CPU性能也不能充分发挥,所以在GPU上表现出更多的性能提升。

      如果原始的代码已经优化到位,那么在GPU加速环境下性能提升通常只有几倍,甚至只有2倍。不过2倍的提升也算是一个满意的结果了,因为CPU核心数量有限,此时已经没有太多的优化空间了。

    ×
    热门文章
    1锐龙3000XT系列处理器天梯榜评测:体质大提升 4.5GHz随便超
    2AMD Ryzen 3000XT处理器评测汇总:频率高一点,体质好一点
    3AMD CEO Lisa Su再次重申他们会在年内推出Zen 3处理器
    4当初强推Windows 10更新的微软,如今却阻止部分设备升级到20H1/2004版本
    5iPhone 12不标配充电头几乎成定局,缩减成本以靠近iPhone 11的售价
    6[视频] 超频玩家之选,AMD锐龙3900XT/3800XT/3600XT评测
    7荣耀、AMD暧昧互动,暗示新的游戏本产品搭载锐龙芯?
    8高效且亲民,雅浚ProArtist W15导热硅脂实物图赏
    9iOS 14 Beta 2更新内容整理:图标调整、增加新的小部件及其他
    已有 3 条评论,每一条合规评论都是对我们的褒奖。
    • 游客 2012-12-01 23:16

      而是因为原始的代码太烂,对多核CPU支持都不够好,所以一旦用在了超多核心的GPU上性能就会大幅提升。 矛盾。。。

      支持(0)  |   反对(0)  |   举报  |   回复

      3#

    • 游客 2012-11-27 19:29

      现在的商家还要脸么!?

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • 游客 2012-11-26 10:32

      看到这新闻我立刻联想到以前的国产软件动不动就要求系统权限然后把自己的文件往system32里面复制之类的..

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    我来评论