MCPLive > 杂志文章 > Zen 4架构3D缓存处理器EPYC 9684X首测

Zen 4架构3D缓存处理器EPYC 9684X首测

2023-09-12MC评测室

记得多年前,电脑内存的主流配置容量还在1GB左右,而现在有这样一款处理器,其内部三级缓存的容量就超过了1GB,达到了1.1GB,如果再加上L1、L2级缓存,其容量绝对超过当年的主流电脑内存容量,它就是AMD最新发布的EPYC 9684X服务器处理器。而现在主流消费级处理器的三级缓存容量也不会超过100MB,即便是很多顶级服务器处理器,它们的三级缓存容量也不会超过400MB。那么AMD为什么要推出三级缓存容量如此大的处理器,三级缓存容量这样大的处理器有什么作用呢?


引入3D缓存,三级缓存容量达1152MB!

EPYC 9084X系列处理器解析

我们知道,缓存的存在是为了解决计算和存储之间的鸿沟,利用昂贵、高速但是小尺寸的SRAM来填补CPU和内存之间的速度鸿沟,同时提高数据命中率,一直以来都是CPU提高性能的不二法门。不过,缓存在超过一定容量之后,后续就很难再对所有应用都带来显著的性能提升了,更明显的性能提升来自缓存敏感型应用,在桌面应用中主要是游戏,在企业级应用中主要是数值计算类应用,比如流体分析、流体模拟、有限元、计算流体力学等应用,这些应用的场景主要是实验室、设计单位、大型企业等,是HPC也就是超级计算机的主要客户群体。

因此针对这些应用的需求,AMD此次特别推出了代号“Genoa-X”的EPYC 9084X系列处理器。与代号“Genoa”的EPYC 9654、EPYC 9554等处理器相比,该产品最大的不同就是增加了3D缓存,即3D V-Cache。从技术本质上来说,Genoa-X的3D V-Cache和之前的产品没有任何不同,都是通过TSV硅穿孔技术,将额外的SRAM缓存芯片直接倒装连接到CPU核心晶圆上预留的缓存连接位置。从AMD给出的图片来看,Genoa-X的采用的是混合键合的方式实现了CPU核心和SRAM核心的连接。AMD可以为每个CCD增加64MB SRAM L3缓存,是原生CCD中包含的32MB的2倍。由于额外增加的缓存是直接连接到整个CCD的缓存总线上的,因此完全可以视作相同的、一致的、均一的本地L3缓存,不存在任何速度、级别方面的差异。


拥有3D缓存的EPYC 9684X处理器也采用SP5 LGA6096封装,不论是在处理器大小面积,还是处理器厚度上,它都与EPYC 9654完全相同。

 


AMD处理器的3D缓存技术主要由混合键合、硅通孔、CCD、结构硅片、64MB 3D三级缓存芯片组成。

 

之前的EPYC 9004系列处理器最多拥有12个CCD,因此AMD要打造EPYC 9084X系列处理器的话,只需在每个CCD上堆叠64MB 3D缓存,相当于总共外置12×64MB=768MB L3缓存,再加上CCD内部原有的12×32MB=384MB L3缓存,总计最多可以实现768MB+384MB=1152MB缓存。这也是EPYC 9084X系列处理器能实现大容量三级缓存的关键原因。


AMD为每个CCD堆叠了64MB的3D V-Cache


AMD的混合键合技术可以有效提高芯片的互联密度与能效比,其连接密度相对2D工艺高了200倍,互联密度相对单纯使用微凸点工艺高了15倍,芯片互联的能效也比微凸点工艺提高了3倍。

目前,EPYC 9084X系列处理器总共包括EPYC 9684X、EPYC 9384X和EPYC 9184X三款产品,其型号后缀都带一个“X”,这也是所有3D V-Cache产品独有的标识。这三款产品的核心数量从高到低分别是96、32和16。相比没有带3D V-Cache的普通EPYC 9004系列产品而言,比如对比EPYC 9654,EPYC 9684X的基准频率高了一些,两款处理器的最大Boost频率则都维持3.7GHz不变,但EPYC 9684X的全核心频率为3.42GHz,比EPYC 9654的3.55GHz全核心频率要略低一些。同时基准频率的提升、缓存容量的大幅增加也让EPYC 9684X的Default TDP热设计功耗达到了400W,而EPYC 9654的Default TDP为360W。三级缓存方面,由于EPYC 9684X使用了全部12个CCD,所以它的3D V-Cache容量达到了768MB,三级缓存总容量为768MB+384MB=1152MB缓存。


EPYC 9084X系列处理器主要拥有三款型号,它们在核心、线程数,缓存容量上各不相同。

剩下两款定位稍低的3D V-Cache EPYC处理器设置则更为保守,与同为32核心、64线程的EPYC 9354对比,EPYC 9384X的基准频率、最高加速频率都要略低一些,功耗为320W。尽管工作频率稍低,但三级缓存的大幅增加还是让EPYC 9384X处理器的Default TDP比EPYC 9354的280W略高一些。EPYC 9184X也是类似情况,其最高加速频率比同为16核心、32线程的EPYC 9174F的最高加速频率低了200MHz,额外的L3缓存还是在频率上带来了些许影响,Default TDP仍为320W。

此外,EPYC 9084X系列处理器的这三款产品也可以根据用户需求、散热条件等进行灵活配置,其处理器功耗可以配置到320W~400W。三级缓存容量方面,由于EPYC 9384X和EPYC 9184X只使用了8个CCD,所以它们的3D V-Cache容量为64MB×8=512MB,三级缓存总容量为512MB+32MB×8=768MB。虽然EPYC 9084X的SKU只有三款,但实际上对HPC用户来说,这样的产品设计已经基本上可以满足用户需求了。AMD给出的应用范围显示,16核心的EPYC 9184X适合电路自动化设计的客户,32核心的EPYC 9384X则适合电路自动化设计、流体计算、有限元分析和结构分析场合,96核心的EPYC 9684X则除了不适合需要高频率的电路自动化设计外,其余的场景都是其应用范围。

 


根据AMD的官方数据,在CFX、流体、LS-DYNA、OpenFOAM等实际测试中,96核心的EPYC 9684X对比60核心的至强铂金8490H拥有很大的领先幅度,最大可以达到2.2~2.9倍性能优势,平均也有2.2~2.4倍性能优势。借助于生产工艺与架构的优势,目前AMD服务器处理器在技术规格上已经远胜于对手,能有这样的成绩完全在我们意料之中,毕竟竞争对手的产品在处理器核心数量、计算线程数量上也大幅落后。那么面对没有3D V-Cache的EPYC 9004处理器,特别是在核心、线程数量上完全相同的产品,EPYC 9084X系列处理器在那些缓存敏感型计算中是否有明显优势呢?

 


在专业应用上,96核心的EPYC 9684X对比英特尔60核心的至强铂金8490H拥有压倒性的性能优势。

为此我们特别采用同为96核心、192线程设计的EPYC 9654处理器与EPYC 9684X处理器进行了对比测试,让我们看看在核心、线程数相同,缓存容量有明显差异的场景下,缓存容量更多的EPYC 9684X处理器表现如何。

 

我们如何测试

本次测试统一考察的是双路系统的性能,因此EPYC 9684X、EPYC 9654处理器都统一使用了AMD Titanite SP5 2P2U双路主板。内存方面,两款处理器单路支持12条内存通道,双路系统支持24条内存通道,因此我们也为它们采用了24通道内存配置。本次测试所使用的内存为三星DDR5 4800 64GB,内存总数量为24根,内存总容量为1.5TB,搭配美光9300系列企业级NVMe SSD。


本次测试统一考察的是双路系统的性能,EPYC 9684X、EPYC 9654处理器都统一采用了AMD Titanite SP5 2P2U双路主板,12通道、24条内存配置。

 

接下来我们在Ubuntu 22.04操作系统下对两款处理器的性能进行了全面测试。为了让读者更好地了解这两款处理器在众多企业级产品中的性能水准,我们还在部分测试中引入了其他处理器已经测试过的成绩。它们是128核心、256线程配置的双路EPYC 9554系统,64核心、128线程配置的双路EPYC 9374F系统,以及128核心、256线程配置,使用DDR4 3200内存的双路EPYC 7763系统。后者隶属第三代EPYC霄龙处理器,采用Zen3处理器架构、TSMC 7nm生产工艺。

 

第四代AMD EPYC处理器双路系统测试平台一览

处理器:EPYC 9684X×2

EPYC 9654×2

内存: 三星DDR5 4800 64GB×24

主板: AMD Titanite

硬盘: 美光9300系列企业级NVMe SSD

系统: Ubuntu 22.04

分享到:

用户评论

用户名:

密码: