E X P

  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

      本年的国际高性能计算、网络、存储和分析会议,简单来说就是SC2013大会将会在下周开幕。对于NVIDIA来说,这个会议可是继他们的GPU技术年会之后的第二大GPU计算会议,通常也是他们夏秋季的发布会场。NVIDIA提前公布了这次要发布的是新一代统一计算架构技术CUDA 6。

      这次NVIDIA不再像以往一样宣传CUDA为我们带来了多少的新功能,而是他们正在专注发展、改进的特性——统一内存寻址。


    CUDA 6进化到统一内存寻址

      CUDA 4开始就已经支持统一虚拟内存寻址,但这只简化了内存管理,最终数据还是需要先通过PCIe搬运到相应的显存上方可使用。

      这次CUDA 6升级为统一内存寻址,NVIDIA给它增加了一个统一的内存系统,将以往的手动搬运数据升级为自动,也就是说,只要是在合法地址空间内,开发者就可以无视系统内存或者是显存直接调用数据,大大提高了开发者的工作效率。


    内存管理代码演示

      不过CUDA 6的统一内存寻址和AMD主导的hUMA异构统一寻址不同的一点在于,后者的所有不同的内核均通过一条双向的内存寻址总线共享内存系统,而前者的数据搬运则依然依赖着PCIe总线,其效率依然会受到PCIe带宽和延迟的限制。

      截止至目前为止,NVIDIA实现统一内存寻址都是经过CUDA技术的,但在接下来将要推出的Maxwell GPU似乎还可以在硬件层面上实现统一虚拟内存寻址,性能可能会比以往更高。

      除此以外,CUDA 6还加入了新的BLAS(基本线性代数)和FTT(傅里叶变换)函数库,每个节点最多支持8个GPU核心;同时NVIDIA还将会针对BLAS和FFTW(离散傅里叶变换)库发布兼容替换函数库,原有的应用只需要替换成新的函数库即可。

      NVIDIA将会在下周一的SC2013大会正式发布CUDA 6,相关开发工具将会在明年年初开放下载,到时候我们再来看看CUDA 6还会有些什么特别的地方吧。

    编译自AnandTech

    ×
    热门文章
    1Thermaltake钢影透EX机箱开售:支持360水冷,10风扇位,299元
    2IGN对横尾太郎与金亨泰进行访谈,横尾太郎表示日本厂商不习惯使用西方技术
    3Win11 AI资源管理器或只支持骁龙X Elite,Intel和AMD处理器可能无法启用
    4英特尔宣布完成业界首台High-NA EUV光刻机组装工作,目前正在进行校准步骤
    5消息称一加 Ace 3 Pro将采用全新的家族式外观设计,且定位不低
    62024Q1中国显示器市场报告出炉:AOC排名第一,整体均价下行
    7优派VX2758-2K-PRO显示器上市:2K@185Hz满血小金刚,首发849元
    8安耐美PlatiGemini 1200W电源评测:全球首款ATX 3.1&12VO双模电源
    9机构预计华为Pura 70系列年内出货量超千万,力助其重夺中国市场榜首位置
    已有 5 条评论,共 5 人参与。
    登录快速注册 后发表评论
    • 游客  2013-11-21 20:47

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 游客  2013-11-18 09:13

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      4#

    • 超能网友研究生 2013-11-17 23:37    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      3#

    • 游客  2013-11-15 20:50

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • 我匿名了  2013-11-15 18:10

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明