下一代Xeon Phi割掉Larrabee尾巴,抛弃纹理单元变身纯计算卡

2014-1-6 10:55  |  作者:bolvar   |  关键字:Intel,Xeon Phi,Knight Landing,Knight Cornor,DDR4

Knight Landing架构的Xeon Phi将割掉开发初期Larrabee架构的尾巴,不再有用于GPU运算的纹理单元,计算血统更加“纯净”。

本文约544字,需1分钟阅读

基于MIC超多核架构的Xeon Phi加速卡目前使用的是代号为“Knight Corner”(地名)的处理器,下一代Xeon Phi代号为Knight Landing(也是地名),升级14nm工艺,核心数增加到72个,双精度浮点性能达到3TFLOPS。随着更多消息披露,Knight Landing架构的Xeon Phi将割掉开发初期Larrabee架构的尾巴,不再有用于GPU运算的纹理单元,计算血统更加“纯净”。

很多人对Xeon Phi的来历并不清楚,Intel开发这种超多核计算加速卡算是无心插柳,它的原型是Intel开发的Larrabee处理器,或者说是Larrabee GPU更合适些,结果Intel搞显卡并不成功,Larrabee计划没等到未来,不过开发的技术转而用于Xeon Phi,包括目前的Knight Corner一代处理器上都还有Larrabee的影子,还保留了用于GPU运算的纹理单元。

Knight Landing一代将使用新的Atom架构,也就是目前Bay Trail处理器上的Silvermont架构,而且会做针对性强化,比如支持512bit的AVX指令集,并提升多核连接能力以支持最多72核心等等。

其他规格此前多少也有过曝光,Knight Landing将集成8-16GB的eDRAM片载缓存,带宽高达500GB/s,此外还支持6通道DDR4内存,最高容量384GB。

另外值得注意的是,未来Knight Landing与Skylake-EX处理器连接的通道可能不再是PCI-E 3.0,Intel准备改用自的QPI总线,因为PCI-E 3.0的带宽延迟大约是1毫秒,太高了,而QPI总线的延迟只有40纳秒。

下一代Xeon Phi加速卡的TDP功耗预计还是300W,不过得益于性能的大幅提升,Knight Landing的每瓦性能比可以从目前的4-6GFLOPS/W提高到14-16GFLOPS/W,还是有很大变化的。

Knight Landing预计在2015年发布,离现在还有一年多的时间,这期间AMD及NVIDIA还可以发布一代甚至两代显卡架构,他们在HPC市场上的竞争还会更加激烈。


  • 游客  2017-08-08 18:00

    游客:

    游客:
    最近在和带Xeon Phi的超算工作,跟CUDA比起来,Xeon Phi的程序真是太——难——写——了—— 希望新一代能好一些
    CUDA必败是注定了,不过不等于NVIDIA就输了。毕竟硬件才是NVIDIA的主业,CUDA只是在当时没有GPU计算的情况下开发出来填补空白再加上是私有标准不被认可,出来一阵热潮之后如今已经今非昔比。现在有了很多新的东西例如OPEN CL,不过对手AMD也支持,而且成绩等更好,还有微软的DIRECT COMPUTE,也是AMD成绩更好。而英特尔的新产品也不会搞自己一套,因为归根到底,硬件商始终是做硬件。暂时来说计算卡谁是霸主这个仍未有定案,只能说拭目以待,但从NVIDIA推出开普勒架构以来,似乎NV越来越不重视计算卡,现在N卡的新产品都是只对游戏负责,其它的成绩都一概不理,这是造成AMD在GCN架构出现之后在微软和开放式两大标准计算上取得好成绩的主要原因。但NV也有底子的,前两代的费米架构仍是很强的针对计算型的架构比现有NV的MAXWELL和开普勒架构都要强。
    2014-05-16 15:41
  • 支持(12)  |   反对(3)  |   举报  |   回复
  • 游客:

    沒記錯Kepler、Maxwell這兩代,淫威大對其的市場細分化非常厲害,要么專門用於遊戲圖形,要么專門用於專業圖形,要么專門用作科學運算。從它們同一GPU核心而有不同程度雙精度浮點數運算能力、不同針對性的驅動程式等應該能看出一些端倪。而農企在這方面就不如淫威大了,但是對於消費者好處也顯而易見:普通的遊戲顯卡仍然擁有不低的專業圖形處理能力和科學運算能力(當然穩定性存疑);而對於農企的壞處就是,專業產品不好賣了......
    2015-03-12 00:41
  • 支持(0)  |   反对(0)  |   举报  |   回复
  • 三年后回来看,说CUDA必败的脸疼吗?

    支持(0)  |   反对(0)  |   举报  |   回复

    358#

  • 游客  2016-08-03 21:09

    hVwm1G Major thanks for the article post.Really thank you! Cool.

    支持(0)  |   反对(0)  |   举报  |   回复

    357#

  • 游客  2015-12-31 22:05

    PKatps

    支持(0)  |   反对(0)  |   举报  |   回复

    356#

  • 游客  2015-11-28 21:05

    pchs44 website not necessarily working precisely clothed in Surveyor excluding stares cool in the field of Chrome. Have any suggestions to aid dose this trouble?

    支持(0)  |   反对(0)  |   举报  |   回复

    355#

  • 游客  2015-11-10 12:14

    HrrmFN Thank you for all of the effort on this blog

    支持(1)  |   反对(0)  |   举报  |   回复

    354#

  • 游客  2015-11-08 22:29

    shqBjd Thanks so much for the blog article.Really thank you! Will read on

    支持(0)  |   反对(0)  |   举报  |   回复

    353#

  • 游客  2015-09-28 03:14

    AK9257 In my opinion you are mistaken. I can prove it. Write to me in PM, we will discuss.

    支持(0)  |   反对(0)  |   举报  |   回复

    352#

  • 游客  2015-03-12 00:41

    游客:

    游客:
    最近在和带Xeon Phi的超算工作,跟CUDA比起来,Xeon Phi的程序真是太——难——写——了—— 希望新一代能好一些
    CUDA必败是注定了,不过不等于NVIDIA就输了。毕竟硬件才是NVIDIA的主业,CUDA只是在当时没有GPU计算的情况下开发出来填补空白再加上是私有标准不被认可,出来一阵热潮之后如今已经今非昔比。现在有了很多新的东西例如OPEN CL,不过对手AMD也支持,而且成绩等更好,还有微软的DIRECT COMPUTE,也是AMD成绩更好。而英特尔的新产品也不会搞自己一套,因为归根到底,硬件商始终是做硬件。暂时来说计算卡谁是霸主这个仍未有定案,只能说拭目以待,但从NVIDIA推出开普勒架构以来,似乎NV越来越不重视计算卡,现在N卡的新产品都是只对游戏负责,其它的成绩都一概不理,这是造成AMD在GCN架构出现之后在微软和开放式两大标准计算上取得好成绩的主要原因。但NV也有底子的,前两代的费米架构仍是很强的针对计算型的架构比现有NV的MAXWELL和开普勒架构都要强。
    2014-05-16 15:41
  • 支持(12)  |   反对(3)  |   举报  |   回复
  • 沒記錯Kepler、Maxwell這兩代,淫威大對其的市場細分化非常厲害,要么專門用於遊戲圖形,要么專門用於專業圖形,要么專門用作科學運算。從它們同一GPU核心而有不同程度雙精度浮點數運算能力、不同針對性的驅動程式等應該能看出一些端倪。而農企在這方面就不如淫威大了,但是對於消費者好處也顯而易見:普通的遊戲顯卡仍然擁有不低的專業圖形處理能力和科學運算能力(當然穩定性存疑);而對於農企的壞處就是,專業產品不好賣了......

    支持(0)  |   反对(0)  |   举报  |   回复

    351#

  • 游客  2014-07-17 18:47

    gskEP3 Major thankies for the blog. Really Great.

    支持(0)  |   反对(0)  |   举报  |   回复

    350#

  • 游客  2014-07-06 09:02

    开发的便利性感觉是:
    OpenACC > C++AMP > CUDA > OpenCL > SIMD类的
    但支持OpenACC的编译器太少了,又难以精确控制。
    手工SIMD的优化(包括Xeon Phi的)太繁琐了。
    CUDA成熟度最高,可利用最新的硬件功能,编码相对容易上手,最关键数学库比较成熟。
    OpenCL通用性较好,CPU simd和GPU都能用,驱动也小,适合通用软件的开发。

    支持(2)  |   反对(0)  |   举报  |   回复

    347#

  • 游客  2014-05-16 15:41

    游客:
    最近在和带Xeon Phi的超算工作,跟CUDA比起来,Xeon Phi的程序真是太——难——写——了—— 希望新一代能好一些
    CUDA必败是注定了,不过不等于NVIDIA就输了。毕竟硬件才是NVIDIA的主业,CUDA只是在当时没有GPU计算的情况下开发出来填补空白再加上是私有标准不被认可,出来一阵热潮之后如今已经今非昔比。现在有了很多新的东西例如OPEN CL,不过对手AMD也支持,而且成绩等更好,还有微软的DIRECT COMPUTE,也是AMD成绩更好。而英特尔的新产品也不会搞自己一套,因为归根到底,硬件商始终是做硬件。暂时来说计算卡谁是霸主这个仍未有定案,只能说拭目以待,但从NVIDIA推出开普勒架构以来,似乎NV越来越不重视计算卡,现在N卡的新产品都是只对游戏负责,其它的成绩都一概不理,这是造成AMD在GCN架构出现之后在微软和开放式两大标准计算上取得好成绩的主要原因。但NV也有底子的,前两代的费米架构仍是很强的针对计算型的架构比现有NV的MAXWELL和开普勒架构都要强。

    支持(12)  |   反对(3)  |   举报  |   回复

    346#

  • 游客  2014-05-13 15:25

    QQ 499686668 北京思腾创新科技发展有限公司 专业提供GPU运算解决方案,TESLA ,PHI 系列现货销售 温经理

    已有6次举报

    支持(0)  |   反对(1)  |   举报  |   回复

    345#

  • 游客  2014-02-17 11:08

    最近在和带Xeon Phi的超算工作,跟CUDA比起来,Xeon Phi的程序真是太——难——写——了—— 希望新一代能好一些

    支持(0)  |   反对(3)  |   举报  |   回复

    344#

  • 游客  2014-01-06 11:46

    游客:
    能用来挖矿吗
    这卡就是为PTS而生的吧喂= =

    支持(0)  |   反对(0)  |   举报  |   回复

    6#

  • 游客  2014-01-06 11:01

    能用来挖矿吗

    支持(0)  |   反对(0)  |   举报  |   回复

    5#

  • 游客  2013-11-22 09:40

    Knight Landing虽然有部分媒体说其内核是Silvermont,其实并不正确的。MIC和Atom在内核上虽然都是源于P54C,不过已经是两条路走,一个走高并行和高浮点运算,一个是走低功耗。而且,14nm应该是Airmont。

    支持(0)  |   反对(0)  |   举报  |   回复

    4#

  • 游客  2013-11-21 22:28

    继续卖处理器送加速卡。

    支持(0)  |   反对(0)  |   举报  |   回复

    3#

  • 游客  2013-11-21 12:31

    依旧是工艺优势,

    支持(0)  |   反对(0)  |   举报  |   回复

    2#

  • 游客  2013-11-21 12:31

    依旧是工艺优势,

    支持(1)  |   反对(0)  |   举报  |   回复

    1#

查看全部评论(19)

回复