E X P

  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

      GPGPU通用计算发展的现在早已过了萌芽期,新一代TOP500超级计算机状元“Titan”使用的就是NVIDIA的Tesla K20加速卡作为运算主力。专业领域离消费者很远,而我们之前做过的测试也显示GPU通用计算也能在图像处理、视频编码这样的日常应用中给消费者带来性能提升。


    GPU编程性能确实有提高,但是没有这么神奇

      如今的显卡一年半左右升级一次,Tesla K20相比上一代Fermi有三倍双精度浮点性能提升,使用GPU加速的代码也有100或者200倍的性能提升,NVIDIA以及AMD展示的代码已经证明了这一前景,不过理念是好的,但是GPU加速真的有这么强大的加速效果吗?

      NVIDIA Tesla事业部总监Sumit Gupta在接受INQ采访时称GPU带来的上百倍性能提升是被现实中未优化的代码打败了。他说:“我们见到的100倍、200倍甚至更高的代码性能提升主要来自大学,NVIDIA已经跟许多大学合作,展示了GPU加速代码有100倍的性能提升。”

      “他们主要来自学术研究机构,如果你仔细看一下为什么这些代码有100倍的性能提升,你就会发现主要原因是他们编写的CPU代码太烂,因为他们中很多并不是专业的计算机科学家,而是生物学家、化学家以及物理学家,他们写的C代码对CPU来说也不够好,所以他们发现在GPU上使用CUDA或者CUDA Fortran编程要比在多核CPU上使用MPI或者多线程编程要容易的多。”

      按照Gupta的说法,其实很多人在GPU编程环境下获得上百倍或更高的代码性能提升的原因并不是GPU编程性能太强大了,而是因为原始的代码太烂,对多核CPU支持都不够好,所以一旦用在了超多核心的GPU上性能就会大幅提升。

      Gupta称在HPC领域中如果代码对多核CPU优化的足够好,那么在GPU加速环境中代码性能提升也就只有5-10倍了,有些情况下还会更少,甚至只有2倍。不过2倍代码加速也很不错了,因为这样的情况下CPU优化已经没有空间了。

      NVIDIA早前在宣传GPGPU通用计算时曾经举过例子,PPT上展示的通常都是使用GPU编程性能可以提升数百倍,令人兴奋不已。如今他们自己也公布实情了,这样的情况通常是因为原始的代码对多核优化不足,连CPU性能也不能充分发挥,所以在GPU上表现出更多的性能提升。

      如果原始的代码已经优化到位,那么在GPU加速环境下性能提升通常只有几倍,甚至只有2倍。不过2倍的提升也算是一个满意的结果了,因为CPU核心数量有限,此时已经没有太多的优化空间了。

    ×
    热门文章
    1Thermaltake钢影透EX机箱开售:支持360水冷,10风扇位,299元
    2Win11 AI资源管理器或只支持骁龙X Elite,Intel和AMD处理器可能无法启用
    3IGN对横尾太郎与金亨泰进行访谈,横尾太郎表示日本厂商不习惯使用西方技术
    4英特尔宣布完成业界首台High-NA EUV光刻机组装工作,目前正在进行校准步骤
    5消息称一加 Ace 3 Pro将采用全新的家族式外观设计,且定位不低
    62024Q1中国显示器市场报告出炉:AOC排名第一,整体均价下行
    7优派VX2758-2K-PRO显示器上市:2K@185Hz满血小金刚,首发849元
    8安耐美PlatiGemini 1200W电源评测:全球首款ATX 3.1&12VO双模电源
    9机构预计华为Pura 70系列年内出货量超千万,力助其重夺中国市场榜首位置
    已有 3 条评论,共 3 人参与。
    登录快速注册 后发表评论
    • 游客  2012-12-01 23:16

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      3#

    • 游客  2012-11-27 19:29

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • 游客  2012-11-26 10:32

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明