E X P
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    传统上CPU适合通用型任务处理,而GPU公认浮点性能强大,GPU通用计算就是用各种方式将GPU的浮点性能转化为通用计算能力,AMD的HSA异构即是一例。早前有消息称Kaveri APU将具备TFLOPS级别的浮点性能(HD 7750级别的性能),不过官方给出的A10-7850K浮点性能为856GFLOPS,理论上数倍于目前的高端四核处理器,实际测试又如何呢?

    Anandtech日前专门分析了Kaveri APU的浮点性能,包括CPU部分和GPU部分,并对比了前两代的Trinity、Llano及Intel的Ivy Bridge、Haswell处理器。此外,他们从AMD处确认Kaveri APU的FP64双精度浮点性能是FP32单精度的1/16,与主流的GCN架构相同(HD 7800以下都是1/16,HD 7900级别的是1/4)。

    CPU浮点性能对比

    首先来看CPU部分的浮点性能对比,峰值CPU浮点性能还要看SIMD阵列的ISA指令集,这里考虑了SSE、AVX(无FMA)及AVX(有FMA,FMA3或者FMA4)几种情况。

    Kaveri APU的Steamroller架构还是模块化的推土机体系,每个模块是2个整数单元和1个弹性浮点单元组成,详细介绍可以参考之前的文章:AMD复仇之剑,Bulldozer推土机预览及展望,而Intel的处理器架构还是传统的1个整数单元+1个浮点单元。

    正因为这种架构设计的不同,Kaveri APU的CPU浮点性能也没什么好惊喜的,Llano APU使用的还是传统的K10架构,SSE浮点性能都要比Kaveri强,不过它是不支持AVX指令的。

    GPU浮点性能

    GPU浮点性能是AMD的重点,这里对比的Intel处理器还多了一个GT3e(整合128MB缓存的)核显。此外,每个GPU的FP64支持也不一样,部分GPU只在某些API中才能支持FP64。Intel的GPU也没有官方资料确认FP32比例,不过Realworldtech之前的分析认为FP64:FP32的比例是4:1。

    另外,Intel只在DirectCompute环境下才启用FP64,OpenCL下没有FP64支持。

    AMD的Trinity/Richland APU情况有些复杂,OpenCL下FP64并非标配,但是可以用私有的cl_amd_fp64变相支持,不过Trinity/Richland APU确实不能在DirectCompute环境下支持FP64。Kaveri APU使用的是GCN架构核心,可以在所有API下支持FP64。

    再来看Kaveri与Haswell的对比。在某些依赖FP64的应用中,Kaveri APU真还不一定适合,其CPU+GPU峰值FP64性能也只有110GFLOPS,开发者最好还是在Haswell CPU核心上好好优化代码的AVX、FMA支持。如果你在使用Windows 8系统,那也可以在Iris Pro上通过C++AMP优化。

    对于FP32单精度浮点运算,Kaveri APU倒是明显胜过了Haswell的GT2及IVB处理器的核显,不过GT3e核显要高过Kaveri。另外,Intel的GPU现在还不支持Linux下的OpenCL加速,不过新驱动已经在路上了。

    在Linux系统上,Kaveri在FP32应用于上要胜出,不过在Windows系统下,GT3e会是Kaveri的强力对手。

    PS:从这个测试来看,浮点性能上AMD的CPU还是那个样,架构设计决定了它不可能跟Intel的处理器相比,GPU浮点性能上还好,除了GT3e之外的Intel核显都不是Kaveri的对手,而且支持的API也更多。不过AMD依赖的是HSA,应用程序才是决定异构运算的关键,这一点AMD任重道远。


    ×
    热门文章
    1小米SU7正式发布,售价21.59万元起
    2TRYX创氪星系品牌发布会:推出AMOLED屏水冷及海景房机箱
    3小米SU7卖21.59万元只是交个朋友,配件才是真赚钱?
    4AMD Granite Ridge ES发货清单被发现:Zen 5架构6/8核心,TDP为150/170W
    5Xbox Series X白色数字版现身,微软打算在今年内发售
    6英特尔下代GPU进一步曝光:两款芯片,对标RTX 4070/4060
    7微星发布SPATIUM M580 FROZR:带有塔式散热器的PCIe 5.0 SSD
    8乔思伯推出新款HP-600下压式风冷散热器:12CM薄扇+回流焊6热管,售价179元起
    9技嘉发布Z790/B760主板新版BIOS:支持14代酷睿CPU关闭CEP功能
    已有 11 条评论,共 28 人参与。
    登录快速注册 后发表评论
    • 游客  2014-01-23 23:20

      该评论年代久远,荒废失修,暂不可见。

      支持(2)  |   反对(3)  |   举报  |   回复

      11#

    • 游客  2014-01-23 22:07

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(2)  |   举报  |   回复

      10#

    • 游客  2014-01-23 20:53

      该评论年代久远,荒废失修,暂不可见。

      支持(2)  |   反对(0)  |   举报  |   回复

      9#

    • 游客  2014-01-23 18:59

      该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(2)  |   反对(2)  |   举报  |   回复

      8#

    • 游客  2014-01-23 18:15

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • 游客  2014-01-23 17:57

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      6#

    • 游客  2014-01-23 17:28

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 游客  2014-01-23 16:06

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      4#

    • 游客  2014-01-23 15:01

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      3#

    • 超能网友高中生 2014-01-23 11:14    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      2#

    • 游客  2014-01-23 10:15

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(1)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明