传统上CPU适合通用型任务处理,而GPU公认浮点性能强大,GPU通用计算就是用各种方式将GPU的浮点性能转化为通用计算能力,AMD的HSA异构即是一例。早前有消息称Kaveri APU将具备TFLOPS级别的浮点性能(HD 7750级别的性能),不过官方给出的A10-7850K浮点性能为856GFLOPS,理论上数倍于目前的高端四核处理器,实际测试又如何呢?
Anandtech日前专门分析了Kaveri APU的浮点性能,包括CPU部分和GPU部分,并对比了前两代的Trinity、Llano及Intel的Ivy Bridge、Haswell处理器。此外,他们从AMD处确认Kaveri APU的FP64双精度浮点性能是FP32单精度的1/16,与主流的GCN架构相同(HD 7800以下都是1/16,HD 7900级别的是1/4)。
CPU浮点性能对比
首先来看CPU部分的浮点性能对比,峰值CPU浮点性能还要看SIMD阵列的ISA指令集,这里考虑了SSE、AVX(无FMA)及AVX(有FMA,FMA3或者FMA4)几种情况。
Kaveri APU的Steamroller架构还是模块化的推土机体系,每个模块是2个整数单元和1个弹性浮点单元组成,详细介绍可以参考之前的文章:AMD复仇之剑,Bulldozer推土机预览及展望,而Intel的处理器架构还是传统的1个整数单元+1个浮点单元。
正因为这种架构设计的不同,Kaveri APU的CPU浮点性能也没什么好惊喜的,Llano APU使用的还是传统的K10架构,SSE浮点性能都要比Kaveri强,不过它是不支持AVX指令的。
GPU浮点性能
GPU浮点性能是AMD的重点,这里对比的Intel处理器还多了一个GT3e(整合128MB缓存的)核显。此外,每个GPU的FP64支持也不一样,部分GPU只在某些API中才能支持FP64。Intel的GPU也没有官方资料确认FP32比例,不过Realworldtech之前的分析认为FP64:FP32的比例是4:1。
另外,Intel只在DirectCompute环境下才启用FP64,OpenCL下没有FP64支持。
AMD的Trinity/Richland APU情况有些复杂,OpenCL下FP64并非标配,但是可以用私有的cl_amd_fp64变相支持,不过Trinity/Richland APU确实不能在DirectCompute环境下支持FP64。Kaveri APU使用的是GCN架构核心,可以在所有API下支持FP64。
再来看Kaveri与Haswell的对比。在某些依赖FP64的应用中,Kaveri APU真还不一定适合,其CPU+GPU峰值FP64性能也只有110GFLOPS,开发者最好还是在Haswell CPU核心上好好优化代码的AVX、FMA支持。如果你在使用Windows 8系统,那也可以在Iris Pro上通过C++AMP优化。
对于FP32单精度浮点运算,Kaveri APU倒是明显胜过了Haswell的GT2及IVB处理器的核显,不过GT3e核显要高过Kaveri。另外,Intel的GPU现在还不支持Linux下的OpenCL加速,不过新驱动已经在路上了。
在Linux系统上,Kaveri在FP32应用于上要胜出,不过在Windows系统下,GT3e会是Kaveri的强力对手。
PS:从这个测试来看,浮点性能上AMD的CPU还是那个样,架构设计决定了它不可能跟Intel的处理器相比,GPU浮点性能上还好,除了GT3e之外的Intel核显都不是Kaveri的对手,而且支持的API也更多。不过AMD依赖的是HSA,应用程序才是决定异构运算的关键,这一点AMD任重道远。
游客 2014-01-23 23:20
该评论年代久远,荒废失修,暂不可见。
支持(2) | 反对(3) | 举报 | 回复
11#
游客 2014-01-23 22:07
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(2) | 举报 | 回复
10#
游客 2014-01-23 20:53
该评论年代久远,荒废失修,暂不可见。
支持(2) | 反对(0) | 举报 | 回复
9#
游客 2014-01-23 18:59
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(2) | 反对(2) | 举报 | 回复
8#
游客 2014-01-23 18:15
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
7#
游客 2014-01-23 17:57
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
6#
游客 2014-01-23 17:28
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
5#
游客 2014-01-23 16:06
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
4#
游客 2014-01-23 15:01
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
3#
超能网友高中生 2014-01-23 11:14 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
2#
游客 2014-01-23 10:15
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(1) | 举报 | 回复
1#