E X P
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    英特尔在去年年底推出了第五代至强可扩展处理器,上市以来已在阿里云、百度云等国内头部云计算公司得到广泛实践,并面向AI场景展现出高性能、低能耗等特性。近日他们举办了一场关于数据中心产品技术的媒体分享会,着重介绍了第五代英特尔至强可扩展处理器在AI领域的突破性技术和其为企业带来的巨大价值。随着AI应用市场的蓬勃发展,越来越多企业计划在未来几年内引入生成式AI技术,预估到2026年相关投资将超过3000亿美元。

    英特尔市场营销集团副总裁庄秉翰指出,最新发布的第五代至强处理器在核心数量、内存带宽和性能指标上均有显著提升,最高可达64核,并通过引入AMX和AVX等与AI相关的新型指令集,提高了处理器主频和整体性能,尤其在应对生成式AI应用时表现出色。第五代至强不仅内存带宽高达5600MT/s,还将三级缓存容量翻了三倍,大大减少了对外部内存的依赖,实现了芯片内部高效数据处理。

    在软硬件优化的共同作用下,第五代至强相较于第四代,在AI训练、实时推理和批量推理任务上展现出最高40%的性能提升。列举了通用服务器基于最近比较火爆的生成式AI大模型GPT-J(6B)和Llama2(13B),在如聊天机器人、内容生成、代码编写和搜索引擎等应用场景中,第五代至强从性能上都可以满足生成式AI大模型的要求,确保了即使是在极短的时间内也能满足高质量的响应。

    值得注意的是,第五代至强在性价比方面同样表现出色,经合作伙伴阿里云和百度云的验证,在运行大规模参数模型如Llama2 70B时,四节点服务器可实现低于100ms的推理延迟,并且在考虑总体部署和运维成本后,采用第五代至强构建的生成式AI服务比传统的服务器云服务初始导入成本节省约50%,凸显出其在实际商业应用中的竞争优势。

    此外,众多OEM合作伙伴已推出搭载第五代至强处理器的一体机产品,证实了即便是7B、13B乃至34B参数级别的大模型推理任务,使用经过AMX和AVX加速的通用处理器也能轻松应对。在特定场景下,例如京东应用第五代至强服务器后,在Llama2 13B模型上获得了50%的性能提升。

    展望未来,英特尔将在2024年推出新一代至强可扩展处理器,新系列产品不仅将延续性能提升,更会注重满足社会对能耗的要求,通过发布更高主频、高性能的CPU核架构以适应数据中心复杂应用需求,同时推出能效核,通过极致每瓦性能比和高密度设计,满足云原生环境下的超高能效计算需求。

    第五代英特尔至强可扩展处理器凭借其在硬件、软件和生态系统的全方位优化,成功助力企业解决生成式AI和其他生产力提升应用,诸如会议纪要提取、内容分析、文生图、机器人客服等多种场景下的工作负载需求,彰显出英特尔在数据中心市场持续引领技术创新的坚实步伐。

    ×
    热门文章
    1AMD Strix Halo渲染图:GCD极其巨大,比两个CCD加起来都要大
    2微星推出PAG FORGE M100L机箱:12个风扇位,支持400mm显卡,售价219元
    3目前DP80 UHBR认证线材最长仅1.2米,难以满足DP 2.1 UHBR20实际使用需求
    4长江存储推出PC41Q:旗下首款商用消费级QLC SSD,最大2TB,双尺寸可选
    5索尼可能在开发新款PlayStation掌机,首发运行PS4游戏
    6AMD宣布Alveo V80计算加速卡量产:配32GB HBM2E,针对内存密集型工作负载
    7育碧公布《不羁联盟》PC配置要求:4K需要RX 6800 XT或RTX 3080
    8英特尔Arc显卡31.0.101.5522 WHQL驱动:为近期新游戏和重要更新进行优化
    9夏日游戏节2024公布第一批合作伙伴,超过55间厂商加入
    欢迎参与评论,每一条合规评论都是对我们的褒奖。
    登录快速注册 后发表评论
    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明