还记得在任何给定的服务器 CPU 中只有几种处理器可供服务器使用吗?可能有几十家供应商,但他们并没有给太多选择,今天,我们只有少数服务器 CPU 设计人员和几家代工厂来进行蚀刻,但计算引擎的种类繁多。
鉴于摩尔定律在晶体管价格/性能方面的改进放缓以及现代服务器需要支持的工作负载的扩大,这是绝对必要的。在 AMD,需要在客户定制需求和企业需要拥有一条有意义且有利可图的产品线之间取得平衡的人是 Dan McNamara,他是服务器业务的高级副总裁兼总经理。
McNamara 的整个职业生涯都在半导体行业,包括在 2004 年加入 FPGA 制造商 Altera 担任业务发展总监之前,创立了一家公司并在另一家公司做销售。在 Altera,McNamara 曾担任销售总监,然后负责应用工程,然后负责 FPGA 制造商的嵌入式部门。当英特尔在 2015 年以 167 亿美元收购 Altera 并创建可编程解决方案集团时,McNamara 经营了四年,然后被任命为网络和自定义逻辑集团的总经理。2020 年 1 月,McNamara 加入 AMD 以帮助引导公司向数据中心扩张——虽然我们没有谈论这个,但可能对 X86 服务器芯片供应商购买 FPGA 制造商有很多想法。
对于这次谈话,我们想坚持现在和未来五到十年内服务器芯片和架构正在发生的事情。
Timothy Prickett Morgan:让我们从上周宣布的“Milan-X”Epyc 服务器芯片及其 3D V-Cache 开始。我们如何看待这种风格的 Epyc 服务器芯片的流行,什么时候所有芯片都有 3D V-Cache?我意识到在制造难度和性能提升之间存在权衡,但如果你试图最大化芯片复合体上的核心空间,那么垂直使用 L3 缓存可能是一个不错的策略,即使对于相对而言小筹码。
Dan McNamara:这是一个有趣的问题,3D V-Cache 是我们更大愿景的一部分,即计算将走向何方,对吧?Milan-X 是通往不同优化点的漫长路线图中的一个点。使用“Naples”Epyc 7001s,我们的客户和我们对通用计算有一个独特的看法,而使用“Rome”Epyc 7002s,我们做了常规版本和高频版本。有了“Milan”Epyc 7003,我们有 Milan、Milan 高频,现在还有带有堆叠缓存的 Milan-X。
去年 11 月,我们对此进行了很多讨论,在这个更广泛的计算大周期中,我们真的相信这是未来,我们相信客户正在寻找许多优化点。
因此,当您从 TCO 和性能的角度来看待 Milan-X 时,想想一个客户试图针对电子设计自动化、计算流体动力学、流体动力学等进行优化。但我们也相信,这就是未来的开始。我们还没有透露很多 Epyc 路线图,但我们在客户端和服务器上都有 3D V-Cache,客户将进行优化,并在它提供真正价值时这样做。
TPM:我明白了。但是,当我看到一个处理复合体时,我知道 3D 堆叠将成为一个问题,因为计算核心会产生热量,而且我知道我可以将 L3 缓存加倍堆叠并获得三倍容量,因为 V-Cache 搭载片上缓存的 I/O 密度是片上缓存的两倍,因此我可以很容易地取回更多的套接字区域来添加内核或加速器或其他任何东西,我想我会这样做一旦制造完善并且可能更实惠,这是理所当然的事情。仅通过堆叠 L3 高速缓存,您就可以在裸片上获得 20% 到 30% 的核心。我认为将出现一个转折点,因为这个原因,这项技术无处不在。对于那些对缓存非常敏感的技术工作负载,您可能会增加三倍堆栈 L3 以进一步提升它。. . .
Dan McNamara:理论上,你是完全正确的,让我稍微扩展一下。如果你考虑未来五年左右的时间,它不仅仅是堆叠内存,而且你知道,在 CPU 内核上。套接字完全异构。因此,能够在封装或板上提供更多异构组件的公司将在这个新时代获胜。
另一件事,我认为你打到了头,是你在 CPU 复合体中的基本级别是什么,然后从那里适当地堆叠。我们与台积电建立了合作伙伴关系,这是一种我们共同开发的混合键合技术,没有微凸点。而且我们知道我们不能将这种表现留在桌面上,我们不能等待,我们现在必须做点什么。但我们也没有试图在这里沸腾海洋,我们知道,我们的 OEM 和 ODM 合作伙伴都知道 Milan-X 并不适合一切。如果你想要好的 TCO、高密度的 VM,那么普通的 Milan 是很好的选择。
正如您从我们的路线图中了解的那样,我们将分叉并更加关注未来。“热那亚”拥有 96 个内核和一个阶跃函数,为核心企业、公共云和高性能计算带来大量额外计算。有了“Bergamo”,我们带来了完全不同的视角,拥有 128 个核心并针对云原生工作负载进行了优化,具有低功耗和非常好的能效和更高的密度。
TPM: 我认为这是一个大容量通用计算时代,你可以通过轻微的 SKU 变化将一千万件产品推向市场,这更多是为了最大限度地提高芯片产量并从功能中获取更多利润。结束了。但是,小批量、精确调整硬件的时代才刚刚开始,您可能只能制作几十万到一百万个特定设计。在任何给定时间,公司的机队中可能只有三个、四个或五个或六个不同的服务器 SKU,但服务器设计的变化,从套接字内部到节点中的套接字和外围设备,将在世界排名前几千的组织中相当高。
丹·麦克纳马拉:你明白了。
TPM:让我们换个档次。服务器市场与十年前的市场对比如何,五年甚至十年后又会是怎样?
Dan McNamara:我认为这正是我们在这里谈论的内容。未来真的是关于不同的优化点,将正确的优化点和软件结合起来,实现异构计算。如果你看看今天的高端超级计算机,它完全是异构的,有 CPU 和 GPU 以及各种不同的技术。随着我们的前进,CPU之外会有不同的优化点。我们有 SmartNIC 和 GPU,以及对等连接。优化正在从仅使用 CPU 完成到使用整个系统完成。
TPM:在我看到的未来,什么是服务器的定义将会变得模糊,即使什么是分布式计算系统的定义也不会更加模糊。这些组件的组织和编排方式与我们今天的方式不同。
我不知道那一天是什么时候,但我认为我所知道的服务器——安装在机架中的 1U、2U 或 4U 外形尺寸的金属外壳的盒子——正在消失。我认为新的计算单元可以扩展 PCI-Express 和 CXL 以及其他覆盖。也许这个计算单元是几个机架,或者整排,或者可能是几排吊起来的。我不知道。但在此范围内,将有 CPU、GPU、FPGA 和定制 ASIC 托盘,它们有少量自己的内存和共享 DDR 内存托盘、共享持久内存托盘,以及构成存储层次结构的机架中的共享闪存存储托盘以及不同层次和层次的互连将这一切结合在一起并将其连接到外部世界。这是新主板。有趣的是,在计算引擎插槽内,
Dan McNamara:我认为这是正确的。你知道,分类计算已经讨论了很长时间,但是未来会有不同内存的孤岛或不同形式的计算孤岛。确实。你今天在云中看到了它,对吧?
TPM: 嗯,我们仍然有服务器,并且机器内部仍然有一个服务器主板,无论它是否有皮肤。但是我们将需要小板或类似的东西来将所有这些静态硬件配置分解成更小的、可组合的系统,然后拥有非常复杂的工作负载管理工具来保持所有这些东西以高利用率运行。这个旋转复合体中不应该有没有被使用的组件。让它在后台进行基于云的蛋白质折叠。. . .
我担心的是,所有这些组装起来的组件之间的 I/O 会吃掉我们的生命,但我想不出更好的方法来做到这一点。
Dan McNamara:确实担心 I/O。对于 I/O,您需要考虑的另一件事是卸载。看看今天的系统,尤其是在云中:您的机器上有存储空间,而您正在浪费存储周期。你为什么要这样做?获取 SmartNIC 并加速它。我们将看到越来越多的这种情况,人们不会将宝贵的周期浪费在可以卸载的东西上。问题是我们如何简化 I/O 以使延迟和带宽处于最佳状态?
TPM: 我在数据中心的任何地方都看到了大规模定制。
Dan McNamara:每个人都在关注大量数据,并试图弄清楚我们如何创造更多的智能和更好的结果。所有这些都需要计算,并且趋势是越来越多的计算。而且我认为我们都在谈论的这种优化肯定会发生,并且会在未来发生更多。AMD 刚刚开始发生这种情况,我们看到了 Milan-X 的一个很好的例子。我们相信这将是一场巨大的胜利,我们知道这并不适合一切。
TPM: 我不认为在第一个版本中,3D V-Cache 可能占 SKU 销售量的 10% 或 20%,但也不会达到 50%。
Dan McNamara:我们不会在那个细节级别上谈论事情,但是不,不会是 50%。我们必须培训我们的销售团队并确保他们了解 3D V-Cache 并不适用于所有工作负载。他们现在知道米兰和米兰-X分别针对的是什么。
TPM: 关于 AMD 在服务器市场份额增长的道路上你能说些什么?我一直在寻找超过 25% 服务器份额阈值的那一天。
丹·麦克纳马拉:我不能说太多。但是您知道,我们显然对我们的份额抱有很高的期望,并且您已经关注了 2021 年和 2022 年初的财务状况。再说一次,我们刚刚进入了一个安静的时期。. . .
TPM: [笑声]你当然做到了!很好的安排这次面试。
最后一个问题:您是否考虑过在您的大规模优化未来可能需要做四路和八路服务器?
Dan McNamara:我们没有公开记录四插槽或更大机器的计划。但我们总是关注它,随着我们发展生态系统,这是一件有趣的事情。我们确实遇到了需要更大内存占用的客户,而 SAP HANA 绝对是更大内存占用和 2P 规模以上规模的关键所在。但是我们现在没有任何公开的计划。
TPM: 嗯,数量不多,但有一些利润。我们怀疑,在每个 SKU 世界的较低数量中,CPU、GPU 和 FPGA 的大规模定制 SKU 也会出现这种情况。如果 TCO 对客户来说效果更好,即使使用成本更高的芯片,您也能够以更高的 ASP 以更低的数量弥补它。这不是很好笑吗?
免费试用尝鲜
贴心会员服务
服务可用性
数据安全保障
全年不间断在线
工作时间:早上9:00-下午6:30
河南快米云网络科技有限公司
公安备案编号:41010302002363
Copyright © 2010-2023 All Rights Reserved. 地址:河南自由贸易区开封片区经济开发区宋城路122号