E X P
本文约 980 字,马上就好…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    为了提高处理器的浮点运算性能,Intel不断拓宽处理器的后端执行单元,从128-bit进化到了今天的512-bit,同时引入新的指令集来让程序利用好硬件特性,但这也对开发者造成了相当的不便。近日Linux的缔造者Linus Torvalds就向Intel的AVX-512开炮了:

    我希望AVX512死的痛快点,这样Intel就能面对现实的问题,而不是通过创造魔法指令集让他们在基准测试中看上去很厉害。

    我希望Intel回归基础:让他们的流程重新转起来,更关注常规的代码,而不是HPC或是其他什么没有意义的特殊情况。

    我以前已经说过了,我现在再说一次:在x86的全盛时期,当Intel一路笑到银行,并杀死他们所有的竞争对手的时候,其他所有人在浮点负载上都绝对要比Intel做的好。Intel的浮点性能很差劲(相对而言),它也并不重要。

    因为绝对没有人会在乎基准测试之外的东西。

    AVX512现在——以及未来也大体如此。是的,你可以找到你需要的东西。但那些东西对卖机器的大局来说没有用。

    另外AVX512有真正的缺点。我宁愿看到晶体管预算被用在其他更为相关的东西上。就算仍然是浮点性能(用在GPU上都比AVX512强)。或者就像AMD那样给我更多的核心(有良好的单线程性能,但没有AVX512这样的垃圾)。

    我希望常规的整数代码能够利用完我的功耗限制,而不是什么夺走最高频率的AVX512功耗病毒(因为人们最后总是用它来做memcpy!),还夺走了核心数量(因为那些无用的垃圾单元占据了空间)。

    是的,是的,我带有偏见。我绝对讨厌浮点的基准测试,我也知道其他人对此很关注。我只是觉得AVX512是绝对错误的东西。它是让我特别讨厌的东西。这是一个典型的用来说明Intel做错了的例子,部分原因来自于Intel增加了市场的碎片化。

    停止使用特殊情况的垃圾,让所有人都关注的那些核心的共同东西尽其所能地运行。然后在旁边做一个基本够用的FPU,人们就很开心了。AVX2已经够用了。

    是的,我脾气暴躁。

    Linus

    Intel在Skylake-Server架构中首次引入了AVX-512特性,但它并没有像之前引入AVX和AVX2那样顺利,因为在使用过程中,用户发现在AVX-512负载下,核心频率会有较大幅度的下降,让性能不升反降,Cloudflare的运维人员在两年前就已经对此做过详细的分析了


    图片来自于DeviantArt,有修改

    正如Linus所说的,这些“魔法指令集”也让x86 CPU变得更为碎片化,程序优化变得越来越困难。而AVX-512在不少场景中是为了AI相关的应用所服务的,对传统应用的作用较小,Linus说的“AVX2够用”确实是目前的情况,更多的浮点运算交给对这方面更拿手的GPU去做才是正确的选择。

    ×
    热门文章
    1微信支付推出“摇一摇免单”:1000万份,最高免单200元
    2余承东称华为麒麟高端芯片将成绝版,并肯定抖音海外版业务
    3吟寻事儿:Raspberry Pi 4 8GB上手初体验
    4Intel泄漏的移动平台路线图解读:Tiger Lake独力支撑全局
    5骁龙芯片被发现有严重漏洞,攻击者可以用来提升特权或发起DoS攻击
    6东芝完全退出笔记本电脑市场
    7小米将推出MIUI印度特别版:不再安装被禁App,包括小米浏览器等
    8华为Mate X2折叠屏手机曝光:采用三星和京东方柔性屏,转用内折叠方案
    9Surface Duo的App Groups是怎样的?我们可以从新的渲染图当中看一眼图标
    已有 49 条评论,每一条合规评论都是对我们的褒奖。
    • 这些评论亮了
    • 游客一代宗师 07-13 16:40  加入黑名单

      Y神刚才说LINUS没有他厉害 但是被举报了 可惜了 留不住精彩的内容。

      已有1次举报

      支持(25)  |   反对(0)  |   举报  |   回复

      24#

    • 游客 07-13 16:35

      nightview麻烦上大号,否则没绩效

      已有2次举报

      支持(36)  |   反对(1)  |   举报  |   回复

      22#

    • 游客一代宗师 07-13 16:27  加入黑名单

      你是不是理解错了什么 AVX512不只是指令集而是特定的计算单元,不是说你有指令集就不需要额外的硬件资源,需要这么大的资源才是吐槽的原因,有用不代表实用 但是更高效的GPU显得无用。
      你都说了某些原因导致效率低不就说明了问题了吗,就是优化难,兼容难。 反而AMD实在得多 核心更多AVX2 更多 基本能抵消AVX512 简单说就是两个AVX2的效率总性能高于一个AVX512.为什么不好好优化AVX2 而去弄一些只能在简单高并行是指令里面才能跑满的AVX512上才是问题。 CPU越是高并行就越难于优化因为你这个功耗远远高于GPU效率远远低于GPU。 如果intel能搞好这个GPU早就没存在的意义了,要么avx512不太实际要么就是intel技术实力没有办法干倒GPU而已。

      已有4次举报

      支持(27)  |   反对(3)  |   举报  |   回复

      19#

    • 游客一代宗师 07-13 15:43  加入黑名单

      Linus没有说够用啊他只是说avx512很多余,交给显卡更高效而已 哈哈, 比如常规基础指令 和特殊的avx512指令 做兼容真是费时费力,还费了CPU的资源,如果不做兼容就要多个版本并存,如果兼容就性能和资源浪费。Linus确实吐槽在点上。

      已有1次举报

      支持(38)  |   反对(0)  |   举报  |   回复

      7#

    • 游客一代宗师 07-13 15:28  加入黑名单

      intel都不敢说Linus他不懂。你敢了

      已有2次举报

      支持(39)  |   反对(6)  |   举报  |   回复

      5#

    • 游客一代宗师 07-13 15:24  加入黑名单

      Y神:Linus你懂个锤子

      已有1次举报

      支持(36)  |   反对(0)  |   举报  |   回复

      3#

    • 游客 07-13 15:19

      Y神:Linus就一写代码的,他懂个锤子的的AVX512

      已有1次举报

      支持(41)  |   反对(0)  |   举报  |   回复

      2#

    • 游客 07-18 09:58

      游客 一代宗师

      intel都不敢说Linus他不懂。你敢了
      07-13 15:28 已有2次举报
    • 支持(39)  |   反对(6)  |   举报  |   回复
    • intel不屑跟一个弱智说

      支持(0)  |   反对(0)  |   举报  |   回复

      49#

    • 游客 07-14 18:34

      该评论因举报过多,自动进入审核状态。

      48#

    • 游客 07-14 17:15

      游客

      该评论因举报过多,自动进入审核状态。

      说这句话的人肯定不懂开发

      支持(2)  |   反对(0)  |   举报  |   回复

      47#

    • 游客 07-14 16:32

      给你们说主要原因吧,就是码农因为AVX512过于繁杂吐槽,只要编码简单,放心一句P都不会放

      已有4次举报

      支持(1)  |   反对(1)  |   举报  |   回复

      46#

    • 游客 07-14 15:35

      游客

      该评论因举报过多,自动进入审核状态。

      nightview,超能网就是搭建在linux的服务器上,没有linux你都没地方喷shit

      支持(8)  |   反对(0)  |   举报  |   回复

      45#

    • 游客 07-14 14:19

      该评论因举报过多,自动进入审核状态。

      44#

    • 游客 07-14 12:28

      游客

      该评论因举报过多,自动进入审核状态。

      有梦真好

      支持(3)  |   反对(0)  |   举报  |   回复

      43#

    • 游客 07-14 11:41

      该评论因举报过多,自动进入审核状态。

      42#

    • 游客 07-14 11:35

      跑分、测试软件可以更多使用intel专用指令集,方便收费

      支持(2)  |   反对(0)  |   举报  |   回复

      41#

    • 游客 07-14 10:19

      游客

      该评论因举报过多,自动进入审核状态。

      不论对错? 但是全错所以不能忍啊

      支持(0)  |   反对(0)  |   举报  |   回复

      40#

    • 游客 07-14 09:27

      该评论因举报过多,自动进入审核状态。

      39#

    • yjhercules终极杀人王 07-14 09:18  加入黑名单

      该评论因举报过多,自动进入审核状态。

      38#

    • 游客 07-14 09:05

      死得
      不是“死的”

      支持(0)  |   反对(0)  |   举报  |   回复

      37#

    • 游客 07-14 08:49

      yjhercules 终极杀人王

      该评论因举报过多,自动进入审核状态。

      这顾左右而言他的本事可真牛,谁提AMD了?谁提驱动了?NMSL❤

      支持(11)  |   反对(0)  |   举报  |   回复

      36#

    • yjhercules终极杀人王 07-14 08:46  加入黑名单

      该评论因举报过多,自动进入审核状态。

      35#

    • cnwjlb2019博士 07-14 07:34  加入黑名单

      随着Xe GPU的完善,AVX512必然逐渐走向死亡!AVX512能做的事情,恰恰是用GPU能做的更好的。AVX512就是2个AVX2合体,理论上有2倍浮点性能,但是却同时有2倍功耗!

      支持(6)  |   反对(0)  |   举报  |   回复

      34#

    • 游客 07-14 06:14

      游客

      10900x相比首发价格已经下降了40%,i蛆目前忙着清仓甩货
      07-13 18:25 已有1次举报
    • 支持(17)  |   反对(0)  |   举报  |   回复
    • 7700K 8700K 10980XE等一堆兄弟表示:???,我们中出了个叛徒

      支持(0)  |   反对(0)  |   举报  |   回复

      33#

    • reizhi研究生 07-14 00:19  加入黑名单

      be laughing all the way to the bank definition: 1. to be earning a lot of money easily

      支持(1)  |   反对(0)  |   举报  |   回复

      32#

    • RainMax大学生 07-13 21:13  加入黑名单

      cnwjlb2019 博士

      该评论因举报过多,自动进入审核状态。

      intel 英伟达傻傻分不清。

      支持(17)  |   反对(0)  |   举报  |   回复

      31#

    • cnwjlb2019博士 07-13 20:58  加入黑名单

      该评论因举报过多,自动进入审核状态。

      30#

    • 游客 07-13 20:55

      游客

      10900x相比首发价格已经下降了40%,i蛆目前忙着清仓甩货
      07-13 18:25 已有1次举报
    • 支持(17)  |   反对(0)  |   举报  |   回复
    • 原来如此!

      支持(1)  |   反对(0)  |   举报  |   回复

      29#

    • 游客 07-13 20:26

      Xeonash 大学生

      哈哈,这张图我记得是Linus以前在某大学座谈会中怒喷Nvidia时的场景。
      07-13 19:57
    • 支持(7)  |   反对(1)  |   举报  |   回复
    • 是的。“NVIDIA,FA U"

      支持(5)  |   反对(1)  |   举报  |   回复

      28#

    • Xeonash大学生 07-13 19:57  加入黑名单

      哈哈,这张图我记得是Linus以前在某大学座谈会中怒喷Nvidia时的场景。

      支持(7)  |   反对(1)  |   举报  |   回复

      27#

    提示:本页有 3 个评论因未通过审核而被隐藏

    加载更多评论

    我来评论
    为你推荐