E X P

  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

      本年的国际高性能计算、网络、存储和分析会议,简单来说就是SC2013大会将会在下周开幕。对于NVIDIA来说,这个会议可是继他们的GPU技术年会之后的第二大GPU计算会议,通常也是他们夏秋季的发布会场。NVIDIA提前公布了这次要发布的是新一代统一计算架构技术CUDA 6。

      这次NVIDIA不再像以往一样宣传CUDA为我们带来了多少的新功能,而是他们正在专注发展、改进的特性——统一内存寻址。


    CUDA 6进化到统一内存寻址

      CUDA 4开始就已经支持统一虚拟内存寻址,但这只简化了内存管理,最终数据还是需要先通过PCIe搬运到相应的显存上方可使用。

      这次CUDA 6升级为统一内存寻址,NVIDIA给它增加了一个统一的内存系统,将以往的手动搬运数据升级为自动,也就是说,只要是在合法地址空间内,开发者就可以无视系统内存或者是显存直接调用数据,大大提高了开发者的工作效率。


    内存管理代码演示

      不过CUDA 6的统一内存寻址和AMD主导的hUMA异构统一寻址不同的一点在于,后者的所有不同的内核均通过一条双向的内存寻址总线共享内存系统,而前者的数据搬运则依然依赖着PCIe总线,其效率依然会受到PCIe带宽和延迟的限制。

      截止至目前为止,NVIDIA实现统一内存寻址都是经过CUDA技术的,但在接下来将要推出的Maxwell GPU似乎还可以在硬件层面上实现统一虚拟内存寻址,性能可能会比以往更高。

      除此以外,CUDA 6还加入了新的BLAS(基本线性代数)和FTT(傅里叶变换)函数库,每个节点最多支持8个GPU核心;同时NVIDIA还将会针对BLAS和FFTW(离散傅里叶变换)库发布兼容替换函数库,原有的应用只需要替换成新的函数库即可。

      NVIDIA将会在下周一的SC2013大会正式发布CUDA 6,相关开发工具将会在明年年初开放下载,到时候我们再来看看CUDA 6还会有些什么特别的地方吧。

    编译自AnandTech

    ×
    热门文章
    1iPhone 13系列选购小建议:优先推荐iPhone 13、13 Pro Max
    2威锋电子发布全球首款USB 4主控,完全兼容USB 4/3.2/2.0和DP 1.4标准规范
    3微软发布Windows 11 Build 22000.194,虚拟机也要求TPM 2.0
    4AMD采用X3D封装的EPYC系列处理器规格曝光,L3缓存容量达768MB
    5AMD Radeon Pro W6800X Duo在Octane渲染测试中领先英伟达RTX A6000
    6Apple又面临官司,这次是因MacBook屏幕开裂
    7明基GV30和GS50便携式投影仪上市,价格分别为599美元和799美元
    8雷蛇发布雷蛇猎魂光蛛V2系列光学游戏机械键盘:更高性能、更低噪音
    9酷睿i5-11400H与锐龙7 5800H的网游对决:谁说6核玩游戏必然不如8核?
    已有 5 条评论,共 5 人参与。
    登录快速注册 后发表评论
    • 游客  2013-11-21 20:47

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 游客  2013-11-18 09:13

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      4#

    • 超能网友研究生 2013-11-17 23:37    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      3#

    • 游客  2013-11-15 20:50

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • 我匿名了  2013-11-15 18:10

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明
    为你推荐