NVIDIA在GTC 2013大会上公开了一个名为Kayla的开发平台,由Tegra 3处理器做CPU,一个未曾露面的GK117图形核心做GPU,它支持CUDA on ARM。NVIDIA解释说推出这个平台是让开发者为未来的设备做好准备,结合最近的消息,这个未来设备指的是代号Logan的Tegra 5,而Kayla正是Logan女朋友的名字,所以这个Kayla也跟Tegra 5很有夫妻相,Tegra 5规格很可能跟它差不多。
Hardware.fr网站在GTC大会期间跟CUDA最初的开发者、现NVIDIA GPU计算技术总经理Ian Buck有过交流,它说Kayla平台的配置和性能跟Tegra 5有很大的关系,但是不愿就此多说。
现在来看看我们已经知道的一些。Kayla的GPU配置是GK117核心,2组SMX单元,384个CUDA核心,从Ian Buck的暗示中我们可以猜测Tegra 5的CUDA单元也是384个,这个看起来很庞大,但是别忘了Tegra 5明年将使用20nm工艺制造,GK117的核心面积我们还不知道,但是目前GT 640/GT 650使用的GK107核心面积是118mm2,但它是28nm工艺的,Tegra 5使用20nm工艺之后核心面积可能缩小到60mm2。
另外用于移动设备的GK117核心还会继续精简规格,比如显存位宽保留一组64bit即可,再加上移动版的频率肯定不可能跟桌面版一样高,所以现在并不能断定384个CUDA核心的功耗就一定控制不住。
Tegra 5至少也会有两个版本,规格较低的可能用于小型平板及智能手机中,规格高的将用于大型平板及Project Shield这样的掌机设备中。
Ian Buck还谈到了CUDA的问题,NVIDIA的路线图上明确表示Tegra 5将支持CUDA,而目前也意识到了CUDA的功耗问题,正在想办法降低功耗,或者说至少允许开发者这么做,Nsight之类的开发工具(包括Tegra版)也会有专门的信息显示功耗。
Kayla选择使用GK117而非GK107核心,意味着Tegra 5的CUDA核心并非GK104那一代的,而是跟GK110架构有关系,后者加强了通用计算以及动态并行之类的技术,不过Tegra 5不需要什么双精度性能,因此消耗资源较多的双精度单元会被砍掉。
最后,Tegra 5上可能还会有CUDA编译器,可以优化功耗效率,但是这个技术目前还出在研究阶段,距离实用可能还有几年时间。NVIDIA最主要的工作还有一点,那就是说服开发者使用中等频率的多线程来取代最高频率下的单线程应用,因为前者不仅性能更高,而且功耗上也有优势。
游客 2013-03-28 15:08
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
4#
游客 2013-03-28 13:56
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
3#
游客 2013-03-28 11:20
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
2#
我匿名了 2013-03-28 11:18
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
1#