首次集成HBM内存,英特尔发布Xeon Max CPU!还有全新Max系列GPU
11月10日动静,英特尔今天正式推出了全球首款装备 HBM 内存的 x86 CPU——Intel Xeon Max 系列CPU,其基于代号Sapphire Rapids-HBM芯片构建。同时,英特尔还推出了基于Ponte Vecchio构建的全新MAX系列GPU。英特尔表达,新产物将为美国能源部阿贡国度尝试室的Aurora超等计算机供给动力。
Xeon MAX CPU
新Xeon MAX CPU中的 56 个内核均为 P 核,可供给 112 个线程和 350W TDP。它接纳基于 EMIB 的设想,分为四个集群。但最有趣的是,它还具有 64 GB 的 HBM2e 内存,分为 4 个 16 GB 的集群,总内存带宽为 1 TB / s,每个内核的 HBM 都超越 1 GB。
英特尔还表达,HBM 内存的集成不需要更改代码,而且应该对用户实现无缝通明。
英特尔公司副总裁兼超等计算集团总司理 jeff McVeigh表达:“为了确保没有 HPC 工做负载落伍,我们需要一个可以将带宽、计算、消费力更大化并最末可使得影响更大化的处理计划。英特尔 Max 系列产物系列为更宽广的市场带来了高带宽内存,以及一个 API,使 CPU 和 GPU 之间的代码共享更容易,并更有效地处理世界上更大的挑战。
展开全文
据介绍,那 56 个内核由四个 Die 构成,并利用英特尔的多芯片互连桥 (EMIB) 停止毗连,此中封拆了 64GB HBM 内存,该平台将接纳 PCIe 5.0 和 CXL 1.1 I / O 接口。
在 HCPG 性能不异的情状下,功耗比 AMD Milan-X 集群低 68%。
AMX 扩展可进步 AI 性能,并为 INT8 和 INT32 累积操做供给比 AVX-512 高 8 倍的峰值吞吐量。
供给在差别 HBM 和 DDR 内存设置装备摆设中运行的灵敏性。
工做负载基准:
天气建模:仅利用 HBM 在 MPAS-A 上比 AMD Milan-X 快 2.4 倍。
分子动力学:在 DeePMD 上,与具有 DDR5 内存的合作产物比拟,性能进步了 2.8 倍。
在性能方面,英特尔称,Xeon Max装备的高带宽内存足以称心最常见的HPC工做负载,与旧的英特尔至强 8380 系列处置器或 AMD EPYC 7773X 比拟,可在某些工做负载中供给接近 5 倍的性能。
新 CPU 中还包罗 20 个加速引擎,次要是用于 AVX-512、AMX、DSA 和英特尔 DL Boost 工做负载。据称,英特尔在 MLPerf DeepCAM 训练中的性能比 AMD 7763 提拔了 3.6 倍,比 NVIDIA 的 A100 提拔了 1.2 倍。
MAX系列GPU
MAX系列GPU接纳了Xe-HPC架构的计算芯片,是独一具有原生光线逃踪加速功用的HPC/AI GPU,旨在加速科学可视化,是针对要求最苛刻的计算工做负载的新根底架构。其拥有64MB的L1缓存和408MB的L2缓存(业界更高),进步了可吞吐量和性能。
根据英特尔过往的介绍,MAX系列GPU所接纳的Ponte Vecchio芯片,是英特尔首个百亿亿次级计算GPU,利用了英特尔有史以来更先进的封拆手艺,拥有超越1000亿个晶体管。其总共有63个模块,包罗了16个Xe-HPG架构的计算芯片、8个Rambo cache芯片、2个Xe根底芯片、11个EMIB毗连芯片、2个Xe Link I/O芯片和8个HBM芯片、以及16个负责TDP输出的模块,通过EMIB与Foveros 3D封拆中整合在一路。
MAX系列GPU供给了多种外形尺寸,以称心差别客户的需求,别离有:
MAX 1100 - 双槽PCIe外形,56个Xe核心和48GB的HBM2e显存,克通过英特尔Xe Link桥接器实现多卡毗连,TDP为300W。
MAX 1350 - OAM模块,112个Xe核心和96GB的HBM2e显存,TDP为450W。
MAX 1550 - 英特尔性能更高的OAM模块,128个Xe核心和128GB的HBM2e显存,TDP为600W。
除了PCIe单卡和OAM模块以外,英特尔还供给了x4 GPU OAM载板和英特尔数据中心GPU Max系列子系统,以实现子系统内的高性能多GPU通信。
据介绍,英特尔Xeon Max CPU 将在 Aurora 超等计算机中初次表态,目前正在阿贡国度尝试室建造。Aurora 有望成为第一台超越 2 exaflops 峰值双精度计算性能的超等计算机。
此外,Aurora 还将率先展现在单个系统中将 Max 系列 GPU 和 CPU 配对的强大功用,拥有超越 10000 个“刀片”,每个“刀片”包罗六个 Max 系列 GPU 和两个至强 Max CPU。
英特尔还推出了测试开发系统,由128个刀片式办事器机架构成,为Aurora早期科学方案的研究人员供给办事。英特尔表达,Aurora超算系统旨在处置高性能计算、AI/ML和大数据阐发工做负载,可实现2 ExaFLOP的峰值计算才能,估计在2023年投入运行。
英特尔下一代Max系列GPU的代号为Rialto Bridge,方案于2024年推出,具有更高的性能和无缝晋级路子。将来英特尔还会推出代号Falcon Shores的XPU,其包罗两品种型的计算单位,别离是CPU和GPU,将普遍利用英特尔的多芯片/多模块办法停止设想,根据目的应用的需求,灵敏配比x86和Xe-HPC架构的内核数量。
编纂:芯智讯-林子 综合自收集