一种名为 Borat 的新型远程访问木马 (RAT) 已出现在暗网市场上,提供易于使用的功能来进行 DDoS 攻击、UAC 绕过和勒索软件部署。
作为 RAT,Borat 使远程威胁参与者能够完全控制受害者的鼠标和键盘,访问文件、网络点,并隐藏他们存在的任何迹象。
该恶意软件允许其操作员选择他们的编译选项来创建小型有效负载,这些有效负载正是他们需要进行高度定制的攻击。
Cyble的研究人员对 Borat 进行了分析,他们在野外发现了它,并对恶意软件进行了采样,以进行一项揭示其功能的技术研究。
Borat 的一些功能 (Cyble)
广泛的功能
目前尚不清楚 Borat RAT 是否在网络犯罪分子之间出售或免费共享,但 Cycle 表示它以包含构建器、恶意软件模块和服务器证书的包的形式出现。
Borat RAT 档案 (Cyble)中的文件
该木马的功能,每个都有自己的专用模块,包括以下内容:
键盘记录 - 监控和记录按键并将它们存储在 txt 文件中
勒索软件——将勒索软件有效载荷部署到受害者的机器上,并通过 Borat 自动生成勒索记录
DDoS – 使用受感染机器的资源将垃圾流量引导到目标服务器
录音- 通过麦克风录制音频(如果有),并将其存储在 wav 文件中
网络摄像头录制- 从网络摄像头录制视频(如果有)
远程桌面- 启动隐藏的远程桌面以执行文件操作、使用输入设备、执行代码、启动应用程序等。
反向代理——设置反向代理以保护远程操作员的身份不被暴露
设备信息——收集基本系统信息
进程空心化——将恶意软件代码注入合法进程以逃避检测
凭据窃取– 窃取存储在基于 Chromium 的 Web 浏览器中的帐户凭据
Discord 令牌窃取– 从受害者那里窃取 Discord 令牌
其他功能——通过播放音频、交换鼠标按钮、隐藏桌面、隐藏任务栏、按住鼠标、关闭显示器、显示空白屏幕或挂起系统来扰乱和迷惑受害者
更多 Borat 的广告功能 (Cyble)
正如 Cyble 的分析所指出的,上述功能使 Borat 本质上是一种 RAT、间谍软件和勒索软件,因此它是一种强大的威胁,可以在设备上进行各种恶意活动。
总而言之,尽管 RAT 的开发人员决定以喜剧电影 Borat 的主角(由 Sacha Baron Cohen 化身)的名字命名,但该恶意软件根本不是开玩笑的。
通过深入挖掘试图找到该恶意软件的来源,Bleeping Computer 发现该有效载荷可执行文件最近被识别为 AsyncRAT,因此它的作者很可能基于他的工作。
通常,威胁参与者通过伪装成游戏和应用程序破解的附加可执行文件或文件分发这些工具,因此请注意不要从不可靠的来源(如种子或阴暗网站)下载任何内容。
一个受损的 Trezor 硬件钱包邮件列表被用来发送虚假的数据泄露通知,以窃取加密货币钱包和存储在其中的资产。
Trezor 是一个硬件加密货币钱包,它允许您离线存储您的加密资产,而不是使用基于云的钱包或存储在您 PC 上的更容易被盗的钱包。
设置新的 Trezor 时,将显示一个 12 到 24 字的恢复种子,如果他们的设备被盗或丢失,所有者可以恢复他们的钱包。
但是,任何知道此恢复种子的人都可以访问钱包及其存储的加密货币,因此将恢复种子存储在安全的地方至关重要。
从今天开始,Trezor 硬件钱包所有者开始收到数据泄露通知,提示接收者下载伪造的 Trezor Suite 软件,该软件会窃取他们的恢复种子。
Trezor 在 Twitter 上证实 ,这些电子邮件是通过他们在 MailChimp 托管的选择加入时事通讯发送的网络钓鱼攻击。
Trezor 后来表示,据称 MailChimp 证实他们的服务受到了针对加密货币公司的“内部人员”的破坏。
ZZQIDC已联系 MailChimp 以了解有关此妥协的更多信息,但目前尚未收到回复。
深入了解 Trezor 攻击
网络钓鱼攻击始于 Trezor 硬件钱包所有者收到声称是数据泄露通知的虚假安全事件电子邮件。
“我们很遗憾地通知您,Trezor 经历了涉及属于我们 106,856 名客户的数据的安全事件,并且与您的电子邮件地址相关联的钱包 [email here] 属于受违规影响的人。”假 Trezor 写道数据泄露网络钓鱼电子邮件。
这些虚假的数据泄露电子邮件称,该公司不知道泄露的程度,所有者应下载最新的 Trezor Suite 以在其硬件钱包上设置新的 PIN。
该电子邮件包含一个“下载最新版本”按钮,该按钮将收件人带到一个网络钓鱼站点,该站点在浏览器中显示为 suite.trezor.com。
然而,该网站是一个 使用 Punycode 字符的域名 ,允许攻击者使用重音或西里尔字符冒充 trezor.com 域,实际域名为 suite.xn--trzor-o51b[.]com。
需要注意的是,合法的 Trezor 网站是 trezor.io。
这个假网站会提示用户下载 Trezor Suite 应用程序,如下图所示。
钓鱼网站推假 Trezor Suite
来源:zzqidc
除了 suite.xn--trzor-o51b[.]com 网站,攻击者还在 URL 上创建了网络钓鱼站点:当访问者下载桌面应用程序时,它将从名为“Trezor-Suite-22.4.0-win-x64.exe”的网络钓鱼站点下载一个虚假的 Trezor Suite 应用程序。
正如您在下面看到的,合法的 Trezor Suite 应用程序是使用“Satoshi Labs, sro”的证书签名的,而伪造的 Windows 版本 [ VirusTotal ] 是由“Neodym Oy”(右)的证书签名的。
伪造和合法 Trezor Suite 下载的数字签名比较
来源:ZZQIDC
由于 Trezor 套件是开源的,攻击者下载了源代码并创建了自己的修改后的应用程序,该应用程序看起来与原始的合法应用程序相同。
具有讽刺意味的是,这个伪造的套件甚至在应用程序的屏幕顶部包含了 Trezor 关于网络钓鱼攻击的警告横幅。
假 Trezor Suite 软件
来源:ZZQIDC
然而,一旦 Trezor 所有者将他们的设备连接到伪造的 Trezor Suite 应用程序,它就会提示他们输入 12 到 24 个单词的恢复短语,该短语会被发送回威胁参与者。
既然威胁参与者有了你的恢复短语,他们就可以使用它将恢复短语导入他们自己的钱包并窃取受害者的加密货币资产。
针对 Ledger 硬件加密钱包所有者的几乎相同的攻击希望网络钓鱼攻击导致伪造的 Ledger Live 软件。
Trezor 所有者应该怎么做?
首先,切勿在任何应用程序或网站中输入您的恢复种子。只能在您尝试恢复的 Trezor 设备上直接输入种子。
由于创建冒充合法网站的相似域很容易,因此在涉及加密货币和金融资产时,请始终在浏览器中键入您尝试访问的域,而不是依赖电子邮件中的链接。
这样,您就知道您要去的是合法站点,而不是冒充它的站点。
此外,Trezor 的官方网站位于 trezor.io,因此其他域,例如 trezor.com,与加密硬件钱包公司无关。
最后,忽略任何声称来自 Trezor 的电子邮件,说明您受到最近数据泄露的影响。如果您担心,请直接联系 Trezor 以获取更多信息,而不是单击这些电子邮件中的链接。
还记得在任何给定的服务器 CPU 中只有几种处理器可供服务器使用吗?可能有几十家供应商,但他们并没有给太多选择,今天,我们只有少数服务器 CPU 设计人员和几家代工厂来进行蚀刻,但计算引擎的种类繁多。
鉴于摩尔定律在晶体管价格/性能方面的改进放缓以及现代服务器需要支持的工作负载的扩大,这是绝对必要的。在 AMD,需要在客户定制需求和企业需要拥有一条有意义且有利可图的产品线之间取得平衡的人是 Dan McNamara,他是服务器业务的高级副总裁兼总经理。
McNamara 的整个职业生涯都在半导体行业,包括在 2004 年加入 FPGA 制造商 Altera 担任业务发展总监之前,创立了一家公司并在另一家公司做销售。在 Altera,McNamara 曾担任销售总监,然后负责应用工程,然后负责 FPGA 制造商的嵌入式部门。当英特尔在 2015 年以 167 亿美元收购 Altera 并创建可编程解决方案集团时,McNamara 经营了四年,然后被任命为网络和自定义逻辑集团的总经理。2020 年 1 月,McNamara 加入 AMD 以帮助引导公司向数据中心扩张——虽然我们没有谈论这个,但可能对 X86 服务器芯片供应商购买 FPGA 制造商有很多想法。
对于这次谈话,我们想坚持现在和未来五到十年内服务器芯片和架构正在发生的事情。
Timothy Prickett Morgan:让我们从上周宣布的“Milan-X”Epyc 服务器芯片及其 3D V-Cache 开始。我们如何看待这种风格的 Epyc 服务器芯片的流行,什么时候所有芯片都有 3D V-Cache?我意识到在制造难度和性能提升之间存在权衡,但如果你试图最大化芯片复合体上的核心空间,那么垂直使用 L3 缓存可能是一个不错的策略,即使对于相对而言小筹码。
Dan McNamara:这是一个有趣的问题,3D V-Cache 是我们更大愿景的一部分,即计算将走向何方,对吧?Milan-X 是通往不同优化点的漫长路线图中的一个点。使用“Naples”Epyc 7001s,我们的客户和我们对通用计算有一个独特的看法,而使用“Rome”Epyc 7002s,我们做了常规版本和高频版本。有了“Milan”Epyc 7003,我们有 Milan、Milan 高频,现在还有带有堆叠缓存的 Milan-X。
去年 11 月,我们对此进行了很多讨论,在这个更广泛的计算大周期中,我们真的相信这是未来,我们相信客户正在寻找许多优化点。
因此,当您从 TCO 和性能的角度来看待 Milan-X 时,想想一个客户试图针对电子设计自动化、计算流体动力学、流体动力学等进行优化。但我们也相信,这就是未来的开始。我们还没有透露很多 Epyc 路线图,但我们在客户端和服务器上都有 3D V-Cache,客户将进行优化,并在它提供真正价值时这样做。
TPM:我明白了。但是,当我看到一个处理复合体时,我知道 3D 堆叠将成为一个问题,因为计算核心会产生热量,而且我知道我可以将 L3 缓存加倍堆叠并获得三倍容量,因为 V-Cache 搭载片上缓存的 I/O 密度是片上缓存的两倍,因此我可以很容易地取回更多的套接字区域来添加内核或加速器或其他任何东西,我想我会这样做一旦制造完善并且可能更实惠,这是理所当然的事情。仅通过堆叠 L3 高速缓存,您就可以在裸片上获得 20% 到 30% 的核心。我认为将出现一个转折点,因为这个原因,这项技术无处不在。对于那些对缓存非常敏感的技术工作负载,您可能会增加三倍堆栈 L3 以进一步提升它。. . .
Dan McNamara:理论上,你是完全正确的,让我稍微扩展一下。如果你考虑未来五年左右的时间,它不仅仅是堆叠内存,而且你知道,在 CPU 内核上。套接字完全异构。因此,能够在封装或板上提供更多异构组件的公司将在这个新时代获胜。
另一件事,我认为你打到了头,是你在 CPU 复合体中的基本级别是什么,然后从那里适当地堆叠。我们与台积电建立了合作伙伴关系,这是一种我们共同开发的混合键合技术,没有微凸点。而且我们知道我们不能将这种表现留在桌面上,我们不能等待,我们现在必须做点什么。但我们也没有试图在这里沸腾海洋,我们知道,我们的 OEM 和 ODM 合作伙伴都知道 Milan-X 并不适合一切。如果你想要好的 TCO、高密度的 VM,那么普通的 Milan 是很好的选择。
正如您从我们的路线图中了解的那样,我们将分叉并更加关注未来。“热那亚”拥有 96 个内核和一个阶跃函数,为核心企业、公共云和高性能计算带来大量额外计算。有了“Bergamo”,我们带来了完全不同的视角,拥有 128 个核心并针对云原生工作负载进行了优化,具有低功耗和非常好的能效和更高的密度。
TPM: 我认为这是一个大容量通用计算时代,你可以通过轻微的 SKU 变化将一千万件产品推向市场,这更多是为了最大限度地提高芯片产量并从功能中获取更多利润。结束了。但是,小批量、精确调整硬件的时代才刚刚开始,您可能只能制作几十万到一百万个特定设计。在任何给定时间,公司的机队中可能只有三个、四个或五个或六个不同的服务器 SKU,但服务器设计的变化,从套接字内部到节点中的套接字和外围设备,将在世界排名前几千的组织中相当高。
丹·麦克纳马拉:你明白了。
TPM:让我们换个档次。服务器市场与十年前的市场对比如何,五年甚至十年后又会是怎样?
Dan McNamara:我认为这正是我们在这里谈论的内容。未来真的是关于不同的优化点,将正确的优化点和软件结合起来,实现异构计算。如果你看看今天的高端超级计算机,它完全是异构的,有 CPU 和 GPU 以及各种不同的技术。随着我们的前进,CPU之外会有不同的优化点。我们有 SmartNIC 和 GPU,以及对等连接。优化正在从仅使用 CPU 完成到使用整个系统完成。
TPM:在我看到的未来,什么是服务器的定义将会变得模糊,即使什么是分布式计算系统的定义也不会更加模糊。这些组件的组织和编排方式与我们今天的方式不同。
我不知道那一天是什么时候,但我认为我所知道的服务器——安装在机架中的 1U、2U 或 4U 外形尺寸的金属外壳的盒子——正在消失。我认为新的计算单元可以扩展 PCI-Express 和 CXL 以及其他覆盖。也许这个计算单元是几个机架,或者整排,或者可能是几排吊起来的。我不知道。但在此范围内,将有 CPU、GPU、FPGA 和定制 ASIC 托盘,它们有少量自己的内存和共享 DDR 内存托盘、共享持久内存托盘,以及构成存储层次结构的机架中的共享闪存存储托盘以及不同层次和层次的互连将这一切结合在一起并将其连接到外部世界。这是新主板。有趣的是,在计算引擎插槽内,
Dan McNamara:我认为这是正确的。你知道,分类计算已经讨论了很长时间,但是未来会有不同内存的孤岛或不同形式的计算孤岛。确实。你今天在云中看到了它,对吧?
TPM: 嗯,我们仍然有服务器,并且机器内部仍然有一个服务器主板,无论它是否有皮肤。但是我们将需要小板或类似的东西来将所有这些静态硬件配置分解成更小的、可组合的系统,然后拥有非常复杂的工作负载管理工具来保持所有这些东西以高利用率运行。这个旋转复合体中不应该有没有被使用的组件。让它在后台进行基于云的蛋白质折叠。. . .
我担心的是,所有这些组装起来的组件之间的 I/O 会吃掉我们的生命,但我想不出更好的方法来做到这一点。
Dan McNamara:确实担心 I/O。对于 I/O,您需要考虑的另一件事是卸载。看看今天的系统,尤其是在云中:您的机器上有存储空间,而您正在浪费存储周期。你为什么要这样做?获取 SmartNIC 并加速它。我们将看到越来越多的这种情况,人们不会将宝贵的周期浪费在可以卸载的东西上。问题是我们如何简化 I/O 以使延迟和带宽处于最佳状态?
TPM: 我在数据中心的任何地方都看到了大规模定制。
Dan McNamara:每个人都在关注大量数据,并试图弄清楚我们如何创造更多的智能和更好的结果。所有这些都需要计算,并且趋势是越来越多的计算。而且我认为我们都在谈论的这种优化肯定会发生,并且会在未来发生更多。AMD 刚刚开始发生这种情况,我们看到了 Milan-X 的一个很好的例子。我们相信这将是一场巨大的胜利,我们知道这并不适合一切。
TPM: 我不认为在第一个版本中,3D V-Cache 可能占 SKU 销售量的 10% 或 20%,但也不会达到 50%。
Dan McNamara:我们不会在那个细节级别上谈论事情,但是不,不会是 50%。我们必须培训我们的销售团队并确保他们了解 3D V-Cache 并不适用于所有工作负载。他们现在知道米兰和米兰-X分别针对的是什么。
TPM: 关于 AMD 在服务器市场份额增长的道路上你能说些什么?我一直在寻找超过 25% 服务器份额阈值的那一天。
丹·麦克纳马拉:我不能说太多。但是您知道,我们显然对我们的份额抱有很高的期望,并且您已经关注了 2021 年和 2022 年初的财务状况。再说一次,我们刚刚进入了一个安静的时期。. . .
TPM: [笑声]你当然做到了!很好的安排这次面试。
最后一个问题:您是否考虑过在您的大规模优化未来可能需要做四路和八路服务器?
Dan McNamara:我们没有公开记录四插槽或更大机器的计划。但我们总是关注它,随着我们发展生态系统,这是一件有趣的事情。我们确实遇到了需要更大内存占用的客户,而 SAP HANA 绝对是更大内存占用和 2P 规模以上规模的关键所在。但是我们现在没有任何公开的计划。
TPM: 嗯,数量不多,但有一些利润。我们怀疑,在每个 SKU 世界的较低数量中,CPU、GPU 和 FPGA 的大规模定制 SKU 也会出现这种情况。如果 TCO 对客户来说效果更好,即使使用成本更高的芯片,您也能够以更高的 ASP 以更低的数量弥补它。这不是很好笑吗?
随着 HPC 和 AI 工作负载变得越来越大,并且对计算能力和带宽能力的要求越来越高,系统架构师在思考未来系统时正试图找出养活这头野兽的最佳方式。
一种系统设计方案涉及将尽可能多的东西塞到硅片上,在封装内集成尽可能多的东西,快速互连可在组件之间提供更低的延迟。这可以从将 CPU 和 GPU 加速器放在混合芯片上的努力中看出,例如 AMD 的加速处理单元 (APU)、Nvidia 的“Grace” CPU 和“Hopper” GPU 混合,以及英特尔即将推出的“猎鹰海岸”套餐。
另一种系统设计方法是分解组件,创建一个可组合的基础架构环境,其中计算和网络被分解为更小的部分,这些部分基本上可以组合成一个资源池,可以根据工作负载的需要进行利用。所需的 CPU 和 GPU 功率以及应用程序使用的内存、I/O 和其他组件从池中获取,然后在工作完成后返回到池中以供其他工作负载使用。
去年我们写过这篇文章,当时可组合织物制造商 Liqid 被国家科学基金会选中,在德克萨斯 A&M 大学安装的名为 Accelerated Computing for Emerging Sciences (ACES) 的原型系统中使用其 Matrix 织物和 Liqid 指挥中心控制器。
这也是德克萨斯高级计算中心 (TACC) 的工程师正在使用其Lonestar6 超级计算机在一个新项目中进行测试的方向,TACC 正在与 GigaIO 在测试平台上合作,以了解这种可组合环境如何工作。
我们猜想,德克萨斯州有一些关于可组合超级计算的东西。
“这是我们在可组合性方面的实验之一,”TACC 执行董事 Dan Stanzione 告诉The Next Platform。“目前这在某种程度上是一个研究项目,但我们正在将其连接到生产系统中,我们将使其可供用户使用并衡量效率。我们将有一些节点直接连接 GPU,然后有一些节点通过这个 PCI 交换机基础设施连接 GPU。我们可能还会在其中添加一些 NVM-Express 设备,但目前,我们只是放入 GPU 以开始使用。”
Lonestar6 是位于德克萨斯州奥斯汀的超级计算机中心的最新集群,这是一个 600 个节点的系统,包括由AMD 的 Epyc“米兰”服务器芯片和Nvidia 的“Ampere”A100 GPU驱动的戴尔系统,并通过 Mellanox 的 HDR InfiniBand(Nvidia 2019 年以 70 亿美元收购)。每个计算节点运行两个 64 核 Epyc 7763 芯片和 256 GB 的 DDR4 内存,而 GPU 节点拥有两个 Epyc 芯片和两个 GPU,每个都有 40 GB 的高带宽内存。鉴于 Lonestar6 运行的数千个工作负载中的很多都没有被重构为由 GPU 加速,因此 Lonestar6 机器中的纯 CPU 节点比配备 GPU 的节点要多得多。
TACC 的 Lonestar6 超级计算机
该机器于今年早些时候投入全面生产,不仅被德克萨斯大学奥斯汀分校的研究人员和学者使用,还被德克萨斯 A&M、德克萨斯理工大学和北德克萨斯大学的研究人员和学者使用,这是一个通用系统Stanzione 说,谁需要同时使用 CPU 和 GPU。
对于该项目,GigaIO 正在利用其可组合基础设施功能来创建分散式服务器基础设施,利用 PCIe 和供应商的通用可组合结构,称为 FabreX。该架构(包括架构管理器、架顶式交换机和网络适配器卡)可根据工作负载的需求快速配置资源,从而创建包含加速器、存储和内存的集群架构。目标是使计算和存储等系统组件更易于访问和共享,从而降低运营和资本成本。
TACC 正在将 GigaIO 技术放入 Lonestar6 的一片片中,大约有 16 个插槽,工程师可以在其中放置 GPU 或 NVM-Express 设备。现在他们将使用 A100 GPU,包括四个 GPU 的静态节点和其他用户可以请求通过结构组成的一个、两个、四个或八个 GPU。
Stanzione 说,GPU 的成本是该项目背后的驱动力。
“GPU 的成本远高于处理器,”他说。“在构建这些多加速器节点时,它们在某种程度上是节点中的主要成本。这是配备 Grace 处理器的 Nvidia 将接管生态系统的原因之一。在他们看来,在某种程度上,它是围绕 GPU 的外壳和数据移动系统。”
不是每个人都能负担得起扩展至他们可能想要的程度,因此 GigaIO 的结构和技术(例如用于 HPC 环境的高速 I/O CXL 标准)是未来发展的先驱。
“现在——尤其是 CXL——是关于,我们能否摆脱这个单一和静态计算节点的概念,转而支持这个可组合的世界,在这个世界中,我们有处理元素、存储元素、存储元素,也许还有加速处理元素,我们可以将每个工作负载组合到最佳屏幕中,”Stanzione 说。“所有这些事情都存在差异,但我们知道我们有很多应用程序,每个节点的速度大约为 2 GB/秒。如果您购买四个 GPU 节点,然后将这些工作放在那里,那么您将经常浪费一半的节点。我们还有其他的,特别是在单节点模型——并行 AI 中——它们可以扩展到尽可能多的用户,并共享每个节点四个、八个、十六个等命名空间。但与其他一切相比,这些都相当少而且相差甚远。”
一种选择是购买混合节点——这发生在一些大学规模的集群中——并且系统被分成小的异构口袋,从而优化了每个工作负载的系统。如果有很多工作需要 GPU,而不是让一些加速器闲置,可以将它们分配给另一个节点,从而更好地利用资源。然而,这在很大程度上依赖于成本和性能之间的权衡。
“就像所有事情一样,关键在于延迟,这在我们的早期测试中看起来相当不错,因为您实际上是在开箱即用它,即使它仍然是 PCIExpress,”他说。“我们增加了一点延迟。它运行得那么顺利吗?您是否需要 NVLink 或CXL 中的连贯性等功能才能真正获得最佳性能,仍然存在广泛的争论。有很多应用程序的 PCI-Express 就足够了,尤其是现在我们有 PCI-Express 4.0 和即将推出的 PCI-Express 5.0。对于许多可以让我们从 GPU 中获得足够好处的代码。在这些情况下,花钱购买 NVLink 之类的东西并不能真正提高性能。”
根据 Stanzione 的说法,这在很大程度上将取决于 AI 软件堆栈的发展方式。然后该行业将了解应该进行哪些权衡。但是,有许多应用程序可以通过同一硬件提供大型多 GPU 节点或多个 GPU 节点的必要性能,因此站点不必购买更多硬件,然后有时让它闲置。
并且利用很重要。TACC 发现其集群中 GPU 和 CPU 的利用率百分比在 80% 到 90% 之间。也就是说,有不同的方法来确定利用率,他说。一个是确定节点是否分配给正在运行作业的用户。另一个是用户使用分配给他们的节点的效率。
更可组合的环境是解决一些利用率问题的一种方式。一些工作需要 GPU 之间的紧密耦合才能扩展,但其他工作(如 AMBER 或 NAMD 分子动力学工作负载)更小,不需要太多带宽即可通过添加 GPU 来获得良好的性能。在去中心化的环境中,调度程序更容易更有效地将 GPU 分布在各种工作负载上,并且必须考虑结构的成本。
“我们正在为结构增加一些成本,这是我们必须理解的权衡之一,因为基本上我们提供给 Giga IO 的所有美元都存在节点成本的增量 [即] 不用于 GPU 和CPU,”Stanzione 说。“这可能是一个很大的部分,但我们必须弄清楚我们增加多少效率与我减去多少美元来花在硬件上的模型。坦率地说,我们可以运行并且我们将对此进行一些实验室基准研究,可能会发表关于这类事情的论文。但要理解这种权衡,我需要在野外使用真实的用户代码运行它。”
这一切是如何摆脱的——趋势是将所有东西集中在硅封装上还是运行可组合的基础设施——尚不清楚。
“我们每年仍然有更多的晶体管空间,”他说。“这就是我们仍然做对的事情是每个芯片更多的晶体管。如果我们开始关注芯片或封装上耦合的 CPU [和] GPU 会怎样?这是否可能 [提供] 数量级的对 CPU 的虚函数调用的改进?也许未来会是,我们现在将计算节点中的所有内容都放在一个单独的包中,然后您只需将这些包存在于某个结构中,这将朝着另一个方向发展,在硅片上集成更多。问题是——就像所有事情一样——我们希望耦合到什么程度?自从集群与向量机出现以来,我们基本上就一直在争论这个问题。传统智慧也经常被证明是错误的。”
这就是为什么像 TACC 这样的地方做实验,所以把一些事实和数据带到一个不确定的未来。
“过去的教训是,我们并不真正知道答案,即使我们认为我们知道,”Stanzione 说。“我们最终可能会进入一个完全分散的世界,在那里我们制造一些廉价的小部件。吸引我的一个原因是所有东西都在模具上,我们在这些东西中获得了荒谬的力量,最终它们很难冷却。你没有足够的表面积,即使我们在上面运行液氮,我们也没有足够的表面积来提取热量。然而,如果我只用几个内核构建非常小的芯片,我们可以将它们组合在一个结构上……我们可以将时钟频率提高到我们都希望它达到 10 GHz 或类似的频率,然后将它们加速到 200-瓦特处理器具有更少的内核,然后我们将所有这些聚合到一个结构中。这可能是一个完全不同的世界。
当Nvidia 在 2019 年 3 月宣布以 69 亿美元收购 Mellanox Technologies 时,每个人都花了很多时间思考两家公司之间的协同效应,以及网络将如何成为运行 HPC 和 AI 的分布式系统中越来越重要的一部分工作量。据我们所知,并非所有人都认为 Nvidia 创建的用于将其 GPU 相互连接并扩展其系统的模拟信号电路是该交易的战略部分。
但是,事实证明,他们是。更具体地说,Nvidia 在设计串行器/解串器电路方面的专业知识 - 芯片的一部分,它采用并行数据流并将其转换为适合通过网络发送的串行数据流 - 在新的 Spectrum-4 800 中发挥了重要作用Nvidia(前身为 Mellanox)最近在 GTC 会议上宣布的 GB/sec 以太网交换机。
早在 2016 年,当我们看到用于数据中心的“Pascal”GP100 GPU 上的 20 Gb/秒 NVLink 端口时,我们就知道 Nvidia 在 SerDes 方面非常出色,而且我们真的看到该公司在泄露 NVSwitch 内存时对 SerDes 是认真的基于“Volta”GV100 和“Ampere”GA100 GPU 的 DGX 系列系统的核心区域网络交换机,以及用于 GPU 的独立式多层 NVLink 4.0 内存互连,将在未来 DGX H100 中使用基于“Hopper”GH100 GPU 的系统是极高带宽和低延迟的开关,我们在此处详细讨论过,其电路可与 Mellanox、Broadcom、Marvell 和其他公司所能承受的任何产品相媲美。
事实上,Nvidia 开发的 SerDes 专业知识对 Mellanox 团队非常有价值,这也是为什么使用 Spectrum-4 交换机,该公司正在从 Spectrum-12.8 Tb/秒的总带宽跃升的原因之一- 3 ASIC 于 2020 年 3 月直接发布了 25.6 Tb/秒的设备,许多人一直期待 51.2 Tb/秒的 Spectrum-4 ASIC。
“在数字方面,借助数据包处理引擎,我想说的是,Mellanox 在市场上遥遥领先,”Nvidia 以太网交换机和 DPU 营销副总裁 Kevin Deierling 表示。“我认为我们拥有世界上最好的数字交换机。现在,作为 Nvidia 的一部分,我们正在利用来自 Nvidia 的世界上最好的模拟 SerDes。模拟电路通常是到达芯片的最重要的项目,您必须确保它能够正常工作。数据包引擎,骰子的数字部分,如果你模拟了它,那就是它的行为方式,就是这样。对于模拟,它既是一门艺术,也是一门科学。”
Deierling 还没有准备好详细说明在 Spectrum-4 ASIC 中使用了 Nvidia 的哪些 SerDes,但他确实告诉我们,SerDes 的性能和功率以及光收发器的节省将成为Spectrum-4 的故事,Nvidia 将在今年晚些时候向我们透露,在 ASIC 及其同伴 ConnectX-7 SmartNIC 和 BlueField-3 DPU 全部批量发货之前进行更深入的研究。我们强烈怀疑 S[pectrum-4 中的相同 SerDes 用于 NVSwitch 3 和 NVLink Switch 1 芯片,但我们还不能证明这一点。
我们可以告诉你的是,Spectrum-4 ASIC 实际上是集成的小芯片的集合,Deierling 不敢说。据我们所知,数字封装和环绕它的通信 SerDes 都是在同一个 4 纳米 4N 工艺中实现的,该工艺来自代工合作伙伴台积电,也用于蚀刻新的“Hopper”GH100显卡。有趣的是,Hopper GPU 是具有 800 亿个晶体管的单片芯片,而 Spectrum-4 ASIC 具有小芯片架构,并且在整个复合体中具有 1000 亿个晶体管。
在未来,可以合理地预期数据包引擎将缩小到更小的晶体管几何尺寸,但考虑到使 SerDes 更小并不总是产生更好的性能,未来几代的 Spectrum ASIC 复合体的 SerDes 块将保持在4N过程。AMD 在其 Epyc 处理器复合体中的 I/O 集线器上也做了同样的事情。对于“Milan”Epyc 7003,I/O 集线器采用 GlobalFoundries 12 纳米工艺蚀刻,但与之相连的计算核心芯片采用台积电 7 纳米工艺蚀刻。
Spectrum-4 ASIC 核心的数据包引擎每秒可处理 376 亿个数据包,是Spectrum-2 每秒可处理 95.2 亿个数据包的 4 倍,而我们估计 Spectrum-每秒可处理约 190 亿个数据包。 3或大约 2 倍的吞吐量。数据包处理速率并不总是与交换机系列的带宽增长同步增长,Mellanox 一直试图在这一指标上击败竞争对手。Spectrum-3 芯片是采用 TSMC 16 纳米工艺蚀刻的单片芯片。
与之前的 Spectrum ASIC 一样,Spectrum-4 ASIC 复合体上的 SerDes 可以组合成 2、4 或 8 个组,以创建给定带宽的以太网端口——在本例中为 200 Gb/秒、400 Gb/秒、和 800 Gb/秒,因为通道速度为 100 Gb/秒(即在去除编码开销之后)。原生信号传输速率为 50 Gb/秒,并且采用 PAM-4 脉冲幅度调制编码,允许每个信号通过两个比特,有效通道速度达到 100 Gb/秒。因此,凭借 2、4 或 8 个通道,Spectrum 4 芯片可以以 200 Gb/秒的速度驱动 256 个端口,以 400 Gb/秒的速度驱动 128 个端口,以 800 Gb/秒的速度驱动 64 个端口——后者对于内部的数据中心互连很重要可以通过以太网线跨越的区域。
对于那些数据中心互连(或所谓的 DCI)用例来说,同样重要的是 Spectrum-4 ASIC 内置了 MACsec 加密,这意味着传输中的数据可以以四分之一的线路速率(或者可能更精确,在以 800 Gb/秒运行的端口的四分之一或以 200 Gb/秒运行的所有端口上)。超大规模和云构建者中用于 DCI 应用程序的交换机的平均加密速率约为 4 Tb/秒,因此是该速率的 3 倍多。
看到 Nvidia 可以将 Spectrum-4 ASIC 分解为以 100 Gb/秒的速度运行 512 个端口的用例,并考虑在 Clos all-to-all 拓扑脊/叶中有多少个交换机跃点,这将是非常有趣的网络可以被淘汰。但我们怀疑,如果许多客户迁移到服务器上的 200 Gb/秒端口,他们会对 12:1 压缩感到满意。像这样:
使用 Spectrum-4 连接 256 台服务器意味着所有机器彼此相距一跳。要将相同的 256 台服务器与 Spectrum-3 交换机连接起来,将需要 12 倍的交换机来构成脊/叶网络,并且在交换机结构上的服务器之间平均需要三跳,从而将网络延迟增加 3 倍。
Spectrum-4 芯片和交换机的定价尚未确定,但 Nvidia 将像 Mellanox 一样销售完整的交换机和 ASIC。定价的经验法则是,对于任何给定的代际跳跃,每个端口的带宽增加 2 倍,每个端口的成本增加 1.5 倍至 1.6 倍。看起来 Nvidia 正在跳过 25.6 Tb/秒的 ASIC 一代,这应该意味着 800 Gb/秒的端口应该运行在 1,800 到 2,000 美元左右,这与 2015 年 100 Gb/秒端口开始时的 100 Gb /sec波首先开始构建。这也与 400 Gb/秒端口目前以接近 1,000 美元的价格运行的事实一致。
Nvidia Spectrum-4 交换机推出的最后一项重大新技术是自适应路由和使用 RoCE 协议改进服务器节点之间的直接内存访问,这是对 RDMA 直接内存访问的重复,它提供了 InfiniBand(Mellanox 和现在Nvidia冠军)如此低的延迟。
自适应路由很重要,特别是对于 AI 训练工作负载和分布式数据库——Mellanox 在那些不想使用 InfiniBand 的人中使用 Spectrum ASIC 获得牵引力的地方。
“我们已经了解了很多关于人工智能和数据库的知识,”Deierling 解释道。“在传统的网络模型中,你有大量的 CPU 线程和大量要连接的套接字,并且网络上有大量的流量。在这里,您可以使用静态路由,例如 Equal Cost Mutli-Path 或 ECMP 路由。一切正常,因为这些是鼠标流,应用程序确实不需要交换大量数据。但是对于 AI 和数据库工作负载,它们确实如此,并且您会得到这些大流量,而对于大流量,您需要更加小心。我们确定大流量发生在哪里,并确保不会在同一链路上发送太多流量,因此我们实现了最佳带宽,因此这些巨大的工作负载可以大规模运行。”
Deierling 表示,这种自适应路由技术源自 InfiniBand 自己的自适应路由,它从一开始就拥有这种路由技术,并且之所以成为可能,是因为 InfiniBand 是“在它很酷之前是软件定义的网络”,并且正在被添加到其以太网产品中两家超大规模企业和云建设者的要求。我们强烈怀疑其中之一是微软,它是 Nvidia InfiniBand 的大客户,但另一个可能是谷歌。
这就是我们这么认为的原因。Spectrum-4 交换机中的另一个新功能是一种称为超精确计时的功能,它实现了精确时间协议,这在大规模分布式数据库中是必需的。使用网络时间协议,它已经在网络中使用了 35 年,您能做的最好的事情是大约 10 毫秒到大约 1 毫秒的同步。任何需要比这更细粒度的东西都需要其他一些计时机制——例如,谷歌在其数据中心使用原子钟来同步其 Spanner 分布式数据库中的数据读写. 借助 Spectrum-4 ASIC 中的超精确计时功能,数据流可以以低至数十纳秒的精度进行标记,这足以跟踪对数据库的写入顺序并确保读取数据部分在写入完成后完成。
这种基于网络的细粒度数据同步对于所有使用或销售大规模数据库的超大规模企业和云建设者以及在基础设施上运行它们或将它们用作这些超大规模企业和云服务的客户来说都是必要的建设者。但看看英伟达能否赢得与谷歌的网络交易将会很有趣。
目前,虚拟服务器已经普及,是企业数字化转型业务不可或缺的技术之一。
经历COVID-19疫情,信息安全、数据传输速度、构建专业化的网络连接环境以尽快满足企业和客户的需求是迫切需要,并将成为2022年的趋势。
因此,ZZQIDC Cloud Server解决方案与Hybrid Connect相结合,是希望在2022年取得突破并增加技术竞争优势的企业的最佳解决方案。
台北,2022年3月31日─ 根据「IDC FutureScape : 2022全球供应链十大预测-针对亚太区的影响」 最新研究指出,到2022 年底,50%的制造供应链将受益于韧性供应链,从而减少10%的中断影响。缺乏供应链能见度、需求变异性增加、交货时间延长和增加的运输成本等因素将令使用人工管理供应链管理科技的业者无所适从。
IDC制造业和能源研究副总裁Stephanie Krishnan表示:「全球对供应链的兴趣增加,以及对环境冲击的关注,使得加速组织的数位化整合成为必要,以确保长期的生存能力。透过数位转型,业者能为他们整个供应链推动业务和可持续发展成果。」台湾vps中华电信机房
有鉴于此,IDC 在亚太区启动了「IDC 供应链科技领导企业奖」,以表扬在整合实体运作、资讯和金流及数位转型方面表现杰出的组织。IDC希望创建一个社群网络,这些组织将持续转型作为其公司和生态体系营运文化的一环。然后,该网络可以共享、学习和创建更好的实践,实现创新并帮助整个供应链的相关企业透过科技采用来提升能力,进一步达成永续的成果并促动合作伙伴生态系统的转型
IDC 供应链科技领导企业奖有四大奖项类别:
1. 供应链营运转型:透过数位科技整合供应链合作伙伴,实现远距货物流通管理。
2. 永续供应链:将绿色或永续作为供应链的核心策略并与供应链合作伙伴一起实现可量化的永续发展目标。
3. 供应链协调:以数据和财务流程赋能的方式,大幅提升供应链合作伙伴间的能见度、透明度和敏捷性,从而加速交易转型。
4. 供应链创新:以独有的科技使用方式达成供应链生态系中多个组织的目标。这种创新可能会衍生新的业务流程和实务、新的商业模式,或者是提供一种创新的科技或应用服务。
提名从即日起到2022 年5 月6 日结束。获奖者将于2022 年6 月3 日通过IDC 供应链科技领导企业奖网站公布,获奖者并将受邀在6 月23 日举行的IDC Live Industry Day 上发表演说。任何科技终端使用者组织(IT End-user Organizations)都可以提名他们的供应链生态系科技专案,或由第三方组织(如机构、协会、IT 供应商等)取得其同意后提名。
所有参赛作品将由物流与供应链管理协会主席Raymon Krishnan 博士组成的评审团进行评估;新加坡国立大学(NUS)副教授Keith Carter;前世界经济论坛供应链和运输行业总监Wolfgang Lehmacher; IDC Manufacturing Insights 研究副总裁Simon Ellis。
拥有 Badoo 约会服务的 Bumble 公司实施了它在 3 月初宣布的意图——该网站停止在俄罗斯和白俄罗斯开放。该站点的桌面版和移动版均无法使用,但服务的基本功能仍可在移动应用程序中使用。
Bumble 拥有服务 Badoo、Bumble 和 Fruitz,此前宣布退出俄罗斯、白俄罗斯和乌克兰——这三个国家去年为公司带来了 2.8% 的收入。除了禁用 Web 界面外,俄罗斯和白俄罗斯用户的应用程序已从 App Store 和 Google Play 商店中删除,订阅也被取消,但建议 Apple 小工具所有者手动禁用它。
从最大的商店中删除应用程序后,将不再进行更新,并且将不再可能在约会服务中注册 - 只有现有帐户的所有者以及已安装应用程序的小工具才能使用这些服务。所有收集的喜欢和喜欢都将被保存,但是,将失去对高级功能的访问权限,并且约会将仅在已注册的受众中可用,现在不会扩大。俄罗斯VPS云服务器精品推荐
RBC回忆说,根据去年 1 月对约会服务市场进行的一项研究结果,Badoo 在每月独立用户数量方面排名第二,仅次于 OK.RU,在费用方面排名第三,跳过了Tinder 和 OK.RU。
Tomorrow Water 是韩国 BKT 公司的子公司,其目标是通过将数据中心与污水处理厂并置来使数据中心更加环保,它声称这种安排可以节省能源和水。
该过程背后的想法相当简单:来自数据中心的热水可用于促进废水处理,从而减少能源需求,而一些处理过的水随后成为数据中心的冷却水。
在韩国,Tomorrow Water现在与三星、Dohwa Engineering 和 BNZ Partners 签署了一份谅解备忘录,共同开发基于这一流程的集成数据中心和卫生基础设施解决方案,该公司称之为 Co-Flow。
Tomorrow Water 已经在美国与可持续设计和工程咨询公司 Arcadis 建立了合作伙伴关系,以评估 Co-Flow 流程并在那里开发类似的数据中心托管项目。
因此,如果您曾经认为互联网是一条下水道,那么您可能很快就会错得离谱。
据 Tomorrow Water 称,Co-Flow 是该公司更广泛计划的一部分,旨在将废水处理、可再生能源发电和数据中心容量等基础设施元素进行托管和互连。其目的是利用它们互补的能源、热量、营养和水的输入和输出,使它们对全球人口更具可持续性和负担得起,它说。
部分解决方案是 BKT 的 Proteus 废水处理技术,该公司已经使用该技术对首尔 Jungnang 水循环中心的废水处理设施进行现代化改造。据 Tomorrow Water 称,这将工厂的总占地面积减少了 60%,如果要在其他站点复制该过程,则由此腾出的空间是可以建造数据中心建筑物的地方。
对数据中心空间的需求正在增长,尤其是在美国,但在世界其他地方也是如此。然而,根据 Tomorrow Water 的说法,由于城市中心缺乏可用于数据中心建设的可用站点,因此无法满足这一需求。Co-Flow 通过使数据中心能够在污水处理厂的现有占地面积内开发,同时还节省了水和能源,创造了一个双赢的局面。
在其他地方,例如,微软与芬兰最大的能源公司合作,在赫尔辛基附近建立一个新的数据中心,通过现有的水管将数据中心的废热通过现有的水管输送到埃斯波周边城市的家庭和企业,从而在冷却服务器的同时为家庭供暖。 Kauniainen,以及 Kirkkonummi 市。
印度,2022 年 3 月 30 日:印度的网络市场,包括以太网交换机、路由器和 WLAN 细分市场,在 2021 年第四季度(10 月至 12 月)期间供应商收入同比增长 13.6%。随着组织希望重新开放校园,对非 DC 网络基础设施的投资在过去几个季度显着增长。话虽如此,供应商仍被视为芯片短缺、货运成本增加、货币波动导致进口成本增加的问题。对于许多供应商而言,基础设施交付周期目前已上升至 26-28 周的水平,并且随着俄罗斯-乌克兰冲突使情况恶化,预计未来几个季度将保持不变。然而,由于供应商正在寻求清理他们的货物积压,
按供应商收入计算,印度的交换机业务在 4Q421 同比增长 25.7%。由于 COVID-19 导致 2020 年第四季度收入急剧下降,非 DC 开关业务同比显着增长 41.5%。在 2022 年 4 月办公室开业之前,组织,特别是服务部门开始对非 DC 部门进行大量投资。DC 切换在 21 年第四季度实现了 9.3% 的高个位数增长率。对交换业务做出贡献的关键行业包括服务、电信、制造和政府。
在经历了强劲的增长之后,印度路由器市场停滞不前,供应商收入同比增长 0.1%,环比下降 10.6%。服务提供商贡献了 61.4% 的路由器投资,是下降的主要原因。然而,企业路由器投资同比增长 25.1%,企业投资路由器进行定期更新和投资,旨在部署 SD-WAN 等解决方案。除了电信,路由的其他关键垂直领域还包括制造、金融和服务。
按供应商收入计算,WLAN 细分市场同比小幅增长 4.5%。虽然企业 WLAN 因组织被压抑的需求而强劲增长,但随着办公室重新开放和印度节日季即将结束,消费者无线需求减弱,因此整个 WLAN 细分市场仅出现边际增长。企业 WLAN 细分市场表现出非常强劲的 45.4% 同比增长,而消费者 WLAN 同比下降 22.0%。
印度企业对 Wi-Fi 6 的吸引力扩大,在 21 年第四季度,Wi-Fi 6 贡献了 75.7% 的接入点收入。由于半导体短缺导致前几代无线接入点的交货时间急剧增加,推动了对 Wi-Fi 6 采用的需求。
印度以太网交换机市场 4Q21
根据IDC 的全球季度以太网交换机跟踪器,印度第四季度以太网交换机市场为 1.631 亿美元(按供应商收入计算),同比增长 25.7%。由于办公室准备在第三波 COVID-19 之后重新开放,企业对非 DC 交换的投资同比增长 41.5%。随着混合工作的优先发展,企业也热衷于在二、三线城市设立卫星办公室,以提高员工满意度,这也增加了对非直流交换设备的需求。随着半导体短缺形势的加剧,企业热衷于在21年第四季度清理积压,为未来的需求创造空间。直流开关部分同比增长 9.3%。服务、电信、制造业和政府是 21 年第四季度的最大贡献者。
思科在 21 年第四季度继续以 54.8% 的份额主导以太网交换机市场,其次是惠普企业 (HPE) 和瞻博网络。由于超大规模投资,印度的 ODM 业务在 21 年第四季度显着增长。
印度路由器市场 4Q21
根据IDC 的全球季度路由器跟踪报告,21 年第四季度印度路由器市场仍然停滞不前,为 7510 万美元(按供应商收入计算),同比增长 0.1%,微乎其微。增长缓慢主要归因于电信服务提供商在路由器投资方面的放缓。21 年第四季度,服务提供商部署同比下降 11.1%。电信厂商的投资主要集中在更新、带宽优化要求、构建边缘云、5G 推出之前的投资等。相反,企业对路由器硬件的投资同比增长 25.1%。企业投资主要集中在针对 SD-WAN 实施的定期路由器更新和部署上。除电信外,主要投资领域还包括制造业、金融业和服务业。
思科在 21 年第四季度以 62.8% 的市场份额领先路由器市场,其次是诺基亚和瞻博网络。
印度 WLAN 市场 4Q21
根据IDC 的全球季度无线 LAN 跟踪器,印度 WLAN 市场在 21 年第四季度的供应商收入方面实现了 4.5% 的边际同比增长,主要受企业无线部门的推动。市场规模为 6450 万美元(按供应商收入计算)。
企业无线领域的业务表现出色,供应商收入同比增长 45.4%。这一增长主要是由企业在第三波 COVID-19 之后在办公室开业之前投资无线基础设施推动的。供应商还专注于清理因芯片短缺而导致的现有积压,以便能够有效地满足未来的需求。人们看到服务组织大力投资于建立主要专注于无线连接的新地点。由于更简单的部署和管理,云管理的无线网络正在收集流。在因 COVID-19 导致长期低迷之后,来自教育垂直领域的投资出现反弹。由于与前几代无线接入点相比,等待时间更短,Wi-Fi 6 贡献了 75.7% 的接入点收入。
按供应商收入计算,消费者网关路由器业务同比大幅下降 22.0%。网关路由器部分的下降是由于在该国多个地区开设办事处以及印度的节日季节即将结束。以 ISP 为渠道,Wi-Fi 6 也开始在消费领域受到关注。不过,网关路由器市场仍以 Wi-Fi 5 出货量为主。
TP-Link 的市场份额为 24.1%,是 21 年第四季度 WLAN 领域的市场领导者。在企业级 WLAN 细分市场中,思科以 19.7% 的市场份额位居市场领导者,其次是慧与,占 18.1%。
苏达桑·拉古纳坦, IDC India 企业网络高级市场分析师表示:“尽管供应商正在努力应对运营挑战,例如不断延长的交货时间和不断增加的投入成本,但对网络基础设施的需求仍然健康。校园投资市场——有线和无线业务在 21 年第四季度迅速扩张。教育等在相当长一段时间内没有支出的垂直领域开始在网络基础设施上支出。考虑到部署和管理基础设施的便利性,尤其是在服务、教育、零售等垂直领域,云管理的基础设施比以往更受关注。企业在很大程度上开始意识到 NaaS 的好处,因为它可以帮助他们迁移到 OPEX不影响服务质量的模式。
IDC 印度预测
就 2021-2026 年的复合年增长率 (CAGR) 而言,以太网交换机、路由器和 WLAN 市场预计将以个位数增长。云、物联网、移动等新兴技术的采用率增加将推动收入增长。IDC 还预计在未来几年内对 5G 部署进行大量投资。