AMD的EpycMilan提供两倍于英特尔至强数据中心的性能

2022-08-06 12:20:00景珊娜
导读 今天,AMD 推出了 Epyc Milan,这是其 Zen 3 架构的服务器 数据中心实现。Epyc Milan 的故事与 Ryzen 5000 讲述的故事大致相同

今天,AMD 推出了 Epyc Milan,这是其 Zen 3 架构的服务器/数据中心实现。Epyc Milan 的故事与 Ryzen 5000 讲述的故事大致相同——大量内核、高升压时钟频率、19% 的代际提升,以及以竞争对手英特尔为代价的大量有礼貌的幸灾乐祸。

AMD 和英特尔之间的比较在服务器机房中比在消费类 PC 和工作站中更加明显,因为这里没有“只有单线程”可以依靠。即使在 AMD 开始主导多线程性能之后,英特尔仍坚持单线程性能领先于 AMD 一段时间。尽管这种领先优势在 2020 年消失了,但英特尔至少仍然可以指出近乎等效的单线程性能,并且对它被压倒的全线程性能的相关性嗤之以鼻。

这不是您可以在数据中心找的借口——Epyc 和 Xeon Scalable 都直接针对大规模多租户、全线程工作负载,而 Xeon Scalable 只是跟不上。

与 Xeon Scalable 正面交锋

稍后我们将介绍 Epyc Milan 中的一些架构变化,但对于真正进入 CPU 架构的读者来说,它们可能不会感到惊讶——从罗马到米兰的过渡是从 Zen 2 到 Zen 的转变3 架构,在机架上使用 Epyc Milan 与在桌面上使用 Ryzen 5000 没有太大区别。

我们更喜欢简单的、脚踏实地的观点:这些处理器比他们的至强竞争对手更快,你可以用更少的物理空间和电力完成更多的工作。AMD 展示了一张带有平滑进度曲线的幻灯片,显示 Epyc 在 2017 年进入高速发展阶段,绕过至强并继续将其竞争对手抛在一边。

我们并不完全确定我们同意平滑——至强可扩展和 Epyc 在 2017 年和 2018 年都处于停滞状态,然后 Epyc 在 2019 年凭借第一个 Zen 2 实现了真正的巨大飞跃。平滑的曲线似乎正在尝试强调 Epyc 继续以稳定的速度改进而不是停滞不前的观点。

无可否认,Epyc 与其最接近的 Xeon 竞争对手之间存在性能差异——而 AMD 的演示则不遗余力地寻求证明这一点。AMD 的旗舰 64 核 Epyc 7763 在 Specrate 2017 整数、Specrate 2017 浮点和 Java 虚拟机基准测试中的性能是 Xeon Gold 6285R 的两倍多。

更令人印象深刻的是,AMD 首席执行官 Lisa Su 展示了一张幻灯片,显示在 Epyc 7763 系统上运行的VDI桌面会话是在 Xeon Platinum 8280 系统上运行的 2.12 倍。唯一剩下的问题是,这些比较是否公平——有些是针对 Xeon Gold,一个是针对 Xeon Platinum,而没有一个是针对最新的英特尔阵容。是什么赋予了?

实际上,对于 8380HL 等较新的至强处理器,实际上没有可公开访问的基准测试——而且它们无论如何也不比至强白金 8280快,即使使用英特尔自己的数字也是如此。在大多数比较中使用 Xeon Gold 6285R 也很有意义——它以相同的 TDP 和显着降低的成本提供与Xeon Platinum 8280几乎相同的性能。

换句话说,这些数字的呈现没有任何我们能找到的“陷阱”——AMD 正在将其旗舰产品与英特尔的旗舰产品进行最合理的正面比较。

从罗马到米兰的建筑变化

Milan 提供的 IPC(每个时钟周期的指令数)比 Rome 高 19%,这主要是由于 Zen 3 改进了分支预测、更宽的执行管道以及增加了每个时钟周期的加载/存储操作。

Zen 3 还提供了比 Zen 2 更统一的 L3 缓存设计。这个需要稍微解释一下——Zen 2/Rome 为每个四核组提供了一个 16MiB 的 L3 缓存;Zen 3/Milan 为每个八核组提供 32MiB。这仍然分解为每核 4MiB 的 L3——但对于多核共享数据的工作负载,Zen 3 更统一的设计可以节省大量成本。

如果 3MiB 的 L3 缓存数据对于 8 个内核是相同的,那么 Rome 将需要在其上刻录 6MiB — 在两个四核分组中的每一个中都有一个相同的副本。相反,Milan 可以在单个缓存中保存相同的 3MiB,为所有八个内核提供服务。这也意味着单个内核可以处理更多的 L3 缓存——米兰的 32MiB 到罗马的 16MiB。结果是为大型工作负载提供更快的内核和缓存通信,并相应减少有效内存延迟。

安全改进

AMD 的 Epyc 普遍享有比英特尔至强更好的安全声誉,这是有充分理由的。自 Epyc Rome 以来,Spectre 和 Spectre V4 推测执行攻击已在硬件以及 OS/Hypervisor 级别得到缓解。Milan 增加了对安全嵌套分页的支持——从不受信任的虚拟机管理程序中保护受信任的虚拟机——以及一项名为 CET 影子堆栈的新功能。

影子堆栈功能通过镜像返回地址来帮助防止面向返回编程攻击——这允许系统检测并缓解成功溢出一个堆栈但未到达影子堆栈的攻击。使用此功能需要操作系统和/或虚拟机管理程序中的软件更新。

Epyc Milan CPU 型号

Epyc Milan 推出了 15 种口味,从具有 180W TDP 的升压时钟高达 4.1G Hz 的八核 72F3 到具有 64 核、升压时钟高达 3.5 GHz 和 280W TDP 的大型 7763。

所有 Milan 型号均提供 SMT(每个内核两个线程)、每个插槽 8 个 DDR4-3200 RAM 通道、128 个 PCIe4 通道、安全内存加密(针对侧信道攻击对系统 RAM 进行加密)、安全加密虚拟化(对单个 VM 进行加密)抵御来自其他虚拟机或主机的旁道攻击)等。

SKU 分为三类——最高的每核性能来自第三位带有“F”的 SKU,范围从八核/180W 72F3 到 32 核/280 W 75F3。(我们怀疑“F”是快速的。)

下一组针对每个插槽的最高核心/线程数进行了优化,具有“76”或“77”,范围从 48C/225W 7643 到 64C/280W 7763。如果您正在寻找每个机架单位的最大火力,您会发现,这些应该是您列表中的第一个型号。

米兰的其余 SKU 阵容以 73、74 或 75 开头,旨在实现“平衡”配置,寻求优化性能和 TCO。这些范围从 16C/155W 7343P 到 32C/225W 7543。

最后,当您在这些 SKU 中的任何一个中看到“P”时,它表示单插槽型号。

与领先的服务器 OEM 商讨米兰

在使用了 AMD 的数据后,我们与Supermicro的现场应用工程高级副总裁Vik Malyala 进行了交谈。Supermicro 已经向选定的客户运送了大约 1,000 台基于米兰的服务器,Malyala 简要确认了 AMD 性能数据的大致轮廓——是的,它们很快,是的,在我们搬家之前,19% 的代际提升是正确的到房间里真正的大象:供应。

据 Malyala 称,AMD 已经承认今年供应链没有很大的回旋余地。Supermicro 被告知,它需要提前预测其对 AMD 的 CPU 供应需求,以便及时交付——Malyala 说这种情况今年适用于许多上游供应商。

尽管 AMD 对 Supermicro 的承诺并不具体——他们希望在充分预测的情况下以“最小的干扰”完成订单——Malyala 表示,到目前为止,AMD 已经实现了其出货目标。Supermicro 正在将与 AMD 与其 OEM 相同的手牵手扩展到其更大的客户,描述了从企业和数据中心到 OEM 的需求预测过程,它也允许它以可预测的方式交付。

当然,这种高级预测和交付并不真正适用于可能每三到 10 年只购买一次服务器的小型企业。Malyala 说,这些组织正在考虑针对小额临时订单的“可能不到三周的情况”。

当我们询问 Supermicro 对 Epyc 与 Xeon 服务器的兴趣程度和订单量时,Malyala 简单地回答说:“[米兰] 的客户兴趣非常强烈。”

免责声明:本文由用户上传,如有侵权请联系删除!