可问答综合首次集成HBM内存，英特尔发布Xeon Max CPU！还有全新Max系列GPU

首次集成HBM内存，英特尔发布Xeon Max CPU！还有全新Max系列GPU

2个月前 (11-18 06:07)阅读2回复0

管理员
注册排名5
经验值101285
级别管理员
主题20257
回复0

楼主

11月10日动静，英特尔今天正式推出了全球首款装备 HBM 内存的 x86 CPU——Intel Xeon Max 系列CPU，其基于代号Sapphire Rapids-HBM芯片构建。同时，英特尔还推出了基于Ponte Vecchio构建的全新MAX系列GPU。英特尔表达，新产物将为美国能源部阿贡国度尝试室的Aurora超等计算机供给动力。

Xeon MAX CPU

新Xeon MAX CPU中的 56 个内核均为 P 核，可供给 112 个线程和 350W TDP。它接纳基于 EMIB 的设想，分为四个集群。但最有趣的是，它还具有 64 GB 的 HBM2e 内存，分为 4 个 16 GB 的集群，总内存带宽为 1 TB / s，每个内核的 HBM 都超越 1 GB。

英特尔还表达，HBM 内存的集成不需要更改代码，而且应该对用户实现无缝通明。

英特尔公司副总裁兼超等计算集团总司理 jeff McVeigh表达：“为了确保没有 HPC 工做负载落伍，我们需要一个可以将带宽、计算、消费力更大化并最末可使得影响更大化的处理计划。英特尔 Max 系列产物系列为更宽广的市场带来了高带宽内存，以及一个 API，使 CPU 和 GPU 之间的代码共享更容易，并更有效地处理世界上更大的挑战。

展开全文

据介绍，那 56 个内核由四个 Die 构成，并利用英特尔的多芯片互连桥 (EMIB) 停止毗连，此中封拆了 64GB HBM 内存，该平台将接纳 PCIe 5.0 和 CXL 1.1 I / O 接口。

在 HCPG 性能不异的情状下，功耗比 AMD Milan-X 集群低 68%。

AMX 扩展可进步 AI 性能，并为 INT8 和 INT32 累积操做供给比 AVX-512 高 8 倍的峰值吞吐量。

供给在差别 HBM 和 DDR 内存设置装备摆设中运行的灵敏性。

工做负载基准：

天气建模：仅利用 HBM 在 MPAS-A 上比 AMD Milan-X 快 2.4 倍。

分子动力学：在 DeePMD 上，与具有 DDR5 内存的合作产物比拟，性能进步了 2.8 倍。

在性能方面，英特尔称，Xeon Max装备的高带宽内存足以称心最常见的HPC工做负载，与旧的英特尔至强 8380 系列处置器或 AMD EPYC 7773X 比拟，可在某些工做负载中供给接近 5 倍的性能。

新 CPU 中还包罗 20 个加速引擎，次要是用于 AVX-512、AMX、DSA 和英特尔 DL Boost 工做负载。据称，英特尔在 MLPerf DeepCAM 训练中的性能比 AMD 7763 提拔了 3.6 倍，比 NVIDIA 的 A100 提拔了 1.2 倍。

MAX系列GPU

MAX系列GPU接纳了Xe-HPC架构的计算芯片，是独一具有原生光线逃踪加速功用的HPC/AI GPU，旨在加速科学可视化，是针对要求最苛刻的计算工做负载的新根底架构。其拥有64MB的L1缓存和408MB的L2缓存（业界更高），进步了可吞吐量和性能。

根据英特尔过往的介绍，MAX系列GPU所接纳的Ponte Vecchio芯片，是英特尔首个百亿亿次级计算GPU，利用了英特尔有史以来更先进的封拆手艺，拥有超越1000亿个晶体管。其总共有63个模块，包罗了16个Xe-HPG架构的计算芯片、8个Rambo cache芯片、2个Xe根底芯片、11个EMIB毗连芯片、2个Xe Link I/O芯片和8个HBM芯片、以及16个负责TDP输出的模块，通过EMIB与Foveros 3D封拆中整合在一路。

MAX系列GPU供给了多种外形尺寸，以称心差别客户的需求，别离有：

MAX 1100 - 双槽PCIe外形，56个Xe核心和48GB的HBM2e显存，克通过英特尔Xe Link桥接器实现多卡毗连，TDP为300W。

MAX 1350 - OAM模块，112个Xe核心和96GB的HBM2e显存，TDP为450W。

MAX 1550 - 英特尔性能更高的OAM模块，128个Xe核心和128GB的HBM2e显存，TDP为600W。

除了PCIe单卡和OAM模块以外，英特尔还供给了x4 GPU OAM载板和英特尔数据中心GPU Max系列子系统，以实现子系统内的高性能多GPU通信。

据介绍，英特尔Xeon Max CPU 将在 Aurora 超等计算机中初次表态，目前正在阿贡国度尝试室建造。Aurora 有望成为第一台超越 2 exaflops 峰值双精度计算性能的超等计算机。

此外，Aurora 还将率先展现在单个系统中将 Max 系列 GPU 和 CPU 配对的强大功用，拥有超越 10000 个“刀片”，每个“刀片”包罗六个 Max 系列 GPU 和两个至强 Max CPU。

英特尔还推出了测试开发系统，由128个刀片式办事器机架构成，为Aurora早期科学方案的研究人员供给办事。英特尔表达，Aurora超算系统旨在处置高性能计算、AI/ML和大数据阐发工做负载，可实现2 ExaFLOP的峰值计算才能，估计在2023年投入运行。

英特尔下一代Max系列GPU的代号为Rialto Bridge，方案于2024年推出，具有更高的性能和无缝晋级路子。将来英特尔还会推出代号Falcon Shores的XPU，其包罗两品种型的计算单位，别离是CPU和GPU，将普遍利用英特尔的多芯片/多模块办法停止设想，根据目的应用的需求，灵敏配比x86和Xe-HPC架构的内核数量。

编纂：芯智讯-林子综合自收集

BIT超级数据分析平台

回帖 剑指十亿估值，汉起酱酒以高品格、文化浓、口碑好强势出圈 DMS落地配送系统的特点有哪些？-深圳敏思达

首次集成HBM内存，英特尔发布Xeon Max CPU！还有全新Max系列GPU 期待您的回复！

取消

首次集成HBM内存，英特尔发布Xeon Max CPU！还有全新Max系列GPU

首次集成HBM内存，英特尔发布Xeon Max CPU！还有全新Max系列GPU 期待您的回复！

插入网络图片