E X P
正努力加载中…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    传统上CPU适合通用型任务处理,而GPU公认浮点性能强大,GPU通用计算就是用各种方式将GPU的浮点性能转化为通用计算能力,AMD的HSA异构即是一例。早前有消息称Kaveri APU将具备TFLOPS级别的浮点性能(HD 7750级别的性能),不过官方给出的A10-7850K浮点性能为856GFLOPS,理论上数倍于目前的高端四核处理器,实际测试又如何呢?

    Anandtech日前专门分析了Kaveri APU的浮点性能,包括CPU部分和GPU部分,并对比了前两代的Trinity、Llano及Intel的Ivy Bridge、Haswell处理器。此外,他们从AMD处确认Kaveri APU的FP64双精度浮点性能是FP32单精度的1/16,与主流的GCN架构相同(HD 7800以下都是1/16,HD 7900级别的是1/4)。

    CPU浮点性能对比

    首先来看CPU部分的浮点性能对比,峰值CPU浮点性能还要看SIMD阵列的ISA指令集,这里考虑了SSE、AVX(无FMA)及AVX(有FMA,FMA3或者FMA4)几种情况。

    Kaveri APU的Steamroller架构还是模块化的推土机体系,每个模块是2个整数单元和1个弹性浮点单元组成,详细介绍可以参考之前的文章:AMD复仇之剑,Bulldozer推土机预览及展望,而Intel的处理器架构还是传统的1个整数单元+1个浮点单元。

    正因为这种架构设计的不同,Kaveri APU的CPU浮点性能也没什么好惊喜的,Llano APU使用的还是传统的K10架构,SSE浮点性能都要比Kaveri强,不过它是不支持AVX指令的。

    GPU浮点性能

    GPU浮点性能是AMD的重点,这里对比的Intel处理器还多了一个GT3e(整合128MB缓存的)核显。此外,每个GPU的FP64支持也不一样,部分GPU只在某些API中才能支持FP64。Intel的GPU也没有官方资料确认FP32比例,不过Realworldtech之前的分析认为FP64:FP32的比例是4:1。

    另外,Intel只在DirectCompute环境下才启用FP64,OpenCL下没有FP64支持。

    AMD的Trinity/Richland APU情况有些复杂,OpenCL下FP64并非标配,但是可以用私有的cl_amd_fp64变相支持,不过Trinity/Richland APU确实不能在DirectCompute环境下支持FP64。Kaveri APU使用的是GCN架构核心,可以在所有API下支持FP64。

    再来看Kaveri与Haswell的对比。在某些依赖FP64的应用中,Kaveri APU真还不一定适合,其CPU+GPU峰值FP64性能也只有110GFLOPS,开发者最好还是在Haswell CPU核心上好好优化代码的AVX、FMA支持。如果你在使用Windows 8系统,那也可以在Iris Pro上通过C++AMP优化。

    对于FP32单精度浮点运算,Kaveri APU倒是明显胜过了Haswell的GT2及IVB处理器的核显,不过GT3e核显要高过Kaveri。另外,Intel的GPU现在还不支持Linux下的OpenCL加速,不过新驱动已经在路上了。

    在Linux系统上,Kaveri在FP32应用于上要胜出,不过在Windows系统下,GT3e会是Kaveri的强力对手。

    PS:从这个测试来看,浮点性能上AMD的CPU还是那个样,架构设计决定了它不可能跟Intel的处理器相比,GPU浮点性能上还好,除了GT3e之外的Intel核显都不是Kaveri的对手,而且支持的API也更多。不过AMD依赖的是HSA,应用程序才是决定异构运算的关键,这一点AMD任重道远。


    ×
    热门文章
    1AMD CEO Lisa Su再次重申他们会在年内推出Zen 3处理器
    2当初强推Windows 10更新的微软,如今却阻止部分设备升级到20H1/2004版本
    3iPhone 12不标配充电头几乎成定局,缩减成本以靠近iPhone 11的售价
    4高效且亲民,雅浚ProArtist W15导热硅脂实物图赏
    5荣耀、AMD暧昧互动,暗示新的游戏本产品搭载锐龙芯?
    6如何启用Windows 10 Version 2004中的硬件加速GPU调度?
    7iOS 14 Beta 2更新内容整理:图标调整、增加新的小部件及其他
    8网页浏览器也能更省电,Chrome新版功能可以带来28%电池续航提升
    9“肚”有两张顶级显卡的性能怪兽,外星人AURORA R11主机评测
    已有 11 条评论,每一条合规评论都是对我们的褒奖。
    • 游客 2014-01-23 23:20

      i3 秒全家

      支持(2)  |   反对(3)  |   举报  |   回复

      11#

    • 游客 2014-01-23 22:07

      AMD在PC端还是远比不上英特尔的,但游戏主机方面就完全相反了,游戏选择PS4,PC选择Intel。

      支持(0)  |   反对(2)  |   举报  |   回复

      10#

    • 游客 2014-01-23 20:53

      Photoshop从CS6版本开始,部分特效滤镜改用OpenCL运算,大大提升了处理效率, i3? 那是什么

      支持(2)  |   反对(0)  |   举报  |   回复

      9#

    • 游客 2014-01-23 18:59

      i3默秒全

      支持(2)  |   反对(2)  |   举报  |   回复

      8#

    • 游客 2014-01-23 18:15

      游客:
      我记得之前的apu出来时都会有一个图形集合,说哪些哪些软件又支持异构计算了
      今年的似乎没有了,是在这个方面碰到困难了吧
      想看往前翻超能的文章自己看去

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • 游客 2014-01-23 17:57

      我记得之前的apu出来时都会有一个图形集合,说哪些哪些软件又支持异构计算了
      今年的似乎没有了,是在这个方面碰到困难了吧

      支持(0)  |   反对(0)  |   举报  |   回复

      6#

    • 游客 2014-01-23 17:28

      游客:
      AMD是Anandtech的赞助厂商,Brian笔下留情没有把话说透:FP64应用,7850K只有不到110Gflops,只有4770K的1/3,4770R的1/4。综合考虑价格和配套软件成熟度,Kaveri基本没戏。
      opencl fp64 4770k为0Gflops

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 游客 2014-01-23 16:06

      游客:
      AMD是Anandtech的赞助厂商,Brian笔下留情没有把话说透:FP64应用,7850K只有不到110Gflops,只有4770K的1/3,4770R的1/4。综合考虑价格和配套软件成熟度,Kaveri基本没戏。
      错了,不是Brian,是个叫Rahul的

      支持(1)  |   反对(0)  |   举报  |   回复

      4#

    • 游客 2014-01-23 15:01

      AMD是Anandtech的赞助厂商,Brian笔下留情没有把话说透:FP64应用,7850K只有不到110Gflops,只有4770K的1/3,4770R的1/4。综合考虑价格和配套软件成熟度,Kaveri基本没戏。

      支持(0)  |   反对(0)  |   举报  |   回复

      3#

    • Little_Fat_Fat高中生 2014-01-23 11:14  加入黑名单

      好马还需配精鞍,软件支持更关键

      支持(1)  |   反对(0)  |   举报  |   回复

      2#

    • 游客 2014-01-23 10:15

      2m4t的7850K怎么可能打赢4C8T的3770K/4770K啊

      要比就拿个I3来啊

      支持(0)  |   反对(1)  |   举报  |   回复

      1#

    我来评论
    为你推荐