• 超能课堂(189):通用计算GPGPU技术发展十余年,现在它开花结果

    倪嘉声 发布于2019-07-04 18:31 / 关键字: CUDA, GPGPU, 异构计算, 通用计算

    GPGPU,简称通用计算技术,是一种让显卡来参与本来CPU计算任务的技术,它从提出到现在不过十余年时间,但是发展堪称神速,本期超能课堂就带大家来了解一下这项技术,并寻找在我们身边GPGPU的应用。

    什么是GPGPU

      详细阅读 

    分享
    | 收藏 | 评论(9)

  • 高性能计算新组合:NVIDIA与Arm合作构建百亿亿次超算

    唐裕之 发布于2019-06-18 09:48 / 关键字: NVIDIA, Arm, CUDA, Exascale, 百亿亿次, E级超算

    现在超算领域已经挺进百亿亿次计算规模了,虽然无论是研发成本还是建设成本都很高,但如中美等国家已经宣布开始投入研发建设了。美国目前在建的Aurora及Frontier中包括加速器等主要硬件分别是由Intel及AMD提供的,而这刚好少了在超算加速领域非常厉害的NVIDIA。在近日的国际超级计算大会上,NVIDIA正式宣布支持Arm CPU,为高性能计算行业构建节能、支持AI的Exascale超算新途径。

    图片来自NVIDIA

      展开阅读 

    分享
    | 收藏 | 评论(6)

  • NVIDIA的RTX 2080显卡配备8GB GDDR6显存,TDP 200W?

    孟宪瑞 发布于2018-08-16 10:47 / 关键字: NVIDIA, 图灵, RTX 2080, 显卡, CUDA

    随着NVIDIA正式发布了Turing图灵架构及Quadro RTX系列显卡,传闻多时的NVIDIA新一代显卡已经尘埃落定了,现在就等几天后的科隆游戏展上正式发布消费级的GeForce RTX了。这次的图灵架构新卡中,目前来看会有GeForce RTX 2080/2070这两款,而TPU网站日前公布了RTX 2080显卡的具体规格,它使用RT104核心,3072个CUDA核心,配备256bit GDDR6显存,容量8GB,TDP功耗为200W。

      详细阅读 

    分享
    | 收藏 | 评论(25)

  • NVIDIA GPU加速训练神经网络,可让助听器分辨力提升9倍

    梁俊豪 发布于2017-01-13 12:00 / 关键字: NVIDIA, CUDA, TensorFlow, cuDNN, 助听器

    现实生活中有一部分听力障碍者因为先天或后天原因导致听力下降,他们需要佩戴助听器来提高声强达到改善听力的目的。不过很遗憾的是,传统的助听器会无差别地放大收集到的所有声音,包括了环境噪音,而真实情况下人耳收集到的声音会经过大脑处理,自动去除环境噪音,因此我们可以清晰听到有效信息。美国俄亥俄州立大学计算机科学与工程的王德良教授利用NVIDIA TITAN X显卡GPU加速功能和深度学习神经网络训练出高效去除噪音的软件,适用于全数字助听器。

      展开阅读 

    分享
    | 收藏 | 评论(7)

  • AMD发布1.3版本Radeon开放计算平台,RX 460即可支持

    梁俊豪 发布于2016-11-15 10:54 / 关键字: AMD, ROCm, 开放计算平台, CUDA

    NVIDIA不仅大力发展显卡业务,而且早已在通用计算的道路上越走越远,AMD想要一时半会追赶上,恐怕难度还不小。不过好在AMD也以意识到“不进则退”,在今年的Supercomputing Conference16上发布了Radeon Open Compute Platform 1.3版本,支持更多显卡以及开放系统,可以帮助科研人员移植现在CUDA软件代码到适合GCN架构显卡上运行。

      详细阅读 

    分享
    | 收藏 | 评论(5)

  • Radeon显卡也支持CUDA了?实际上是AMD给NVIDIA挖坑

    bolvar 发布于2015-11-17 10:47 / 关键字: AMD, NVIDIA, 玻尔兹曼计划, CUDA

    为了推动GPU通用计算,AMD联络多家公司成立了HSA异构运算基金会,今年9月份已经推出了1.0版HSA规范。只不过HAS虽然人多势众,但AMD在GPU通用计算上还是不如NVIDIA的CUDA做得好,这次的TOP500计算机中有104台是异构系统的,其中使用NVIDIA加速卡的有66台,使用AMD显卡的只有3台。为了解决这个问题,AMD在SC15国际超算会议上宣布了一个“玻尔兹曼计划”,可以让自家的Radeon显卡运行原本针对CUDA开发的代码,这是要把NVIDIA气死啊!

      详细阅读 

    分享
    | 收藏 | 评论(23)

  • GTX 980规格曝光:2560个CUDA核心,64个ROP,双6pin供电

    bolvar 发布于2014-09-06 10:20 / 关键字: NVIDIA, GTX 980, GM204, 4GB显存, 2560 CUDA

    再过两周NVIDIA就要发布Maxwell架构的新一代GTX 980/970显卡了,部分规格我们已经知道了——256bit位宽,4GB显存,未来甚至还会有8GB版的。但是完整的第二代Maxwell架构对我们来说还是个谜,不过有些网站无意中曝光了显卡的完整规格,比如GTX 980所用的核心拥有2560个CUDA核心,160个TMU纹理单元,64个ROP单元,双插槽,6+6pin供电。

      展开阅读 

    分享
    | 收藏 | 评论(62)

  • NVIDIA解读Maxwell优势:同功耗下性能提升4倍

    bolvar 发布于2014-06-10 15:39 / 关键字: NVIDIA, Maxwell, 功耗比, CUDA

    一年一度的产业盛会Computex2014台北电脑展刚刚落下帷幕,在此次展会中笔者有幸对NVIDIA负责GeForce产品线的高管Justin Walker先生进行的专访,在访谈中Justin Walker先生阐述了NVIDIA新一代Maxwell构架所带来的产业革新并解释了Maxwell的幕后故事,以下为现场纪实。

      展开阅读 

    分享
    | 收藏 | 评论(14)

  • POWER+Tesla,IBM联手NVIDIA推进企业数据中心发展

    john-li 发布于2013-11-19 15:19 / 关键字: NVIDIA, IBM, 超级计算机, CUDA, POWER, 超算, 英伟达

      今天NVIDIA和IBM宣布,他们计划就IBM Power System的一系列企业软件应用的GPU加速版本进行合作。

      NVIDIA表示,这次合作将是GPU加速技术第一次超越超级电脑领域,并进入到企业规模的数据中心核心。合作的目的是要让IBM的客户获得更快的处理速度,更好的安全性,可以分析大量的流数据。

      展开阅读 

    分享
    | 收藏 | 评论(2)

  • NVIDIA的PhysX扩展Flex将支持DC加速,AMD显卡也有戏?

    bolvar 发布于2013-11-18 11:14 / 关键字: AMD, NVIDIA, PhysX, Felx, CUDA, Directcompute

      从《古墓丽影》中的头发特效TressFX开始AMD也在搞自己的物理加速技术了,前几天的APU大会上还公布了TressFX 2.0,不再只局限于头发渲染,支持的渲染类型更多,而且渲染速度更快。NVIDIA在物理加速领域比AMD出手更早,PhysX特效一直是N卡的专有福利之一。NVIDIA最近发布了PhysX新扩展Flex,旨在统一各种物理加速,而且支持CUDA和DirectCompute两种方式,后一种实现方式预示着AMD的显卡也有可能支持NVIDIA的PhysX加速了。

    NVIDIA上月宣布了PhysX扩展Flex

      展开阅读 

    分享
    | 收藏 | 评论(10)

  • AMD副总:本月再推Never Settle Forever,CUDA要玩完

    bolvar 发布于2013-08-05 09:11 / 关键字: AMD, Never Settle, CUDA, Physx, 战地4

      负责渠道销售的AMD高级副总Roy Taylor日前接受了VR-Zone的采访,双方谈到了目前的PC市场萎缩、APU的发展、Nerver Settle游戏捆绑以及竞争对手的产品及技术等等,其中有不少爆料或者尖锐的意见。

      展开阅读 

    分享
    | 收藏 | 评论(16)

  • 游戏之外的战场,GTX Titan、HD 7970再战GPU加速

    bolvar 发布于2013-07-11 12:51 / 关键字: GPU通用计算, GTX Titan, HD 7970, CUDA

      拜GPU通用计算概念所赐,如今的消费级GPU除了游戏性能之外,广大读者也对其GPU通用计算能力深有兴趣。Radeon HD 7000之前的AMD显卡在GPU通用性能上一直不如NVIDIA显卡,不过GCN这一代碰到是NVIDIA的GK104家族,后者的双精度浮点性能做了大幅精简,而NVIDIA又在GK110架构上强化了双精度运算,一时间AMD和NVIDIA形成了微妙的平衡。

      详细阅读 

    分享
    | 收藏 | 评论(10)

  • NVIDIA:不是GPU加速太强而是原始代码太烂

    bolvar 发布于2012-11-26 09:39 / 关键字: GPGPU, CUDA, NVIDIA, Tesla K20

      GPGPU通用计算发展的现在早已过了萌芽期,新一代TOP500超级计算机状元“Titan”使用的就是NVIDIA的Tesla K20加速卡作为运算主力。专业领域离消费者很远,而我们之前做过的测试也显示GPU通用计算也能在图像处理、视频编码这样的日常应用中给消费者带来性能提升。

    GPU编程性能确实有提高,但是没有这么神奇

      展开阅读 

    分享
    | 收藏 | 评论(3)

  • GTC大会前瞻,GK110、新版开发工具及CUDA开源

    bolvar 发布于2012-05-15 11:43 / 关键字: NVIDIA, GTC 2012, CUDA, Nsight

      距离GTC 2012大会还有不到12小时,NVIDIA老总黄仁勋将在当天上午10点半发表开幕演讲,除了宣讲NVIDIA在GPU计算上的最新技术之外,最重磅的消息应该是公布“70亿晶体管巨兽”的GK110显卡。

      有关GK110到底是新架构芯片还是双核GK104的Tesla版本不得而知,后一种说法有几分可信度,因为GK104正好是35.4亿晶体管,双核的GTX 690在功耗和发热上控制也很不错,至于之前暴露的GK104浮点运算能力不足的问题也是可以解决的。

      详细阅读 

    分享
    | 收藏 | 评论(3)

  • 三大特性助力,NVIDIA推出4.1版CUDA并行计算平台软件

    Blade 发布于2012-01-30 16:08 / 关键字: NVIDIA, CUDA, 并行计算

      近日NVIDIA正式宣布,其CUDA并行计算平台将推出全新的版本,新版平台为4.1版,包含有三大全新特性,可让CUDA并行编程变得更轻松、更迅速。

      展开阅读 

    分享
    | 收藏 | 评论

1 2 3 4 5 6 7 8 9 10 ...25