在9款显卡服务器中如何选择最佳配置NVIDIA GPU

发布时间:2022-01-18 14:47

2021 年春季,NVIDIA 推出了基于 Ampere 架构的新系列 RTX Ax000 和 Ax0 显卡,具有第三代张量核心。我们为 Selectel 服务器选择了最好的。

那时,已经可以  从ZZQIDC租用配备 Tesla M60、T4、V100 GPU 甚至高端 NVIDIA A100 的专用和云服务器。

由于我们只为客户提供采用现代技术的最新硬件,因此我们决定是时候更新显卡系列了。提供 NVIDIA 宣布的所有视频卡对我们和我们的客户来说都是不合理的。最后,我将告诉你我们如何选择最好的,并在测试构建中分享我们的基准测试结果。

我们在ZZQIDC选择硬件(视频卡、处理器和其他组件)的方法非常简单。我们假设客户希望以最低的成本有效地解决他们的业务问题。因此,我们从以下公式开始:

据此,我们在新显卡中选择了领导者。

考虑了哪些视频卡

我们比较了九种 GPU:从 A2000 到 A6000、A10、A16、A30、A40 和 A100 PCIe 的 RTX 显卡。A2000 仅在今年夏天发布,但这并没有阻止我们审查芯片的规格和测试样品。

在这里,我们拥有 RTX Ax000“家族”——从较旧的 A5000 到较年轻的 A2000。

所有测试参与者都是服务器显卡,桌面 GeForce RTX 3080 和 3090 不在列表中。这些卡(准确地说是安装 NVIDIA 驱动程序)禁止在数据中心的服务器中使用。制造商严格监控对限制的遵守情况:违规制裁不仅适用于供应商,还适用于租用带有桌面硬件的服务器或在其上安装 NVIDIA 软件的客户。

为了评估显卡,我们从对解决客户经常遇到的问题很重要的几个特征开始。也就是说,我们查看了这些 GPU 的一般用途。核心的用途以简化的形式呈现,每种类型都会影响显卡的性能。

其中:

  1. CUDA 核心数(不知道的人,这是 NVIDIA 视频芯片中标量计算单元的符号)。内核越多,卡通常可以更好地处理图形和计算。
  2. 张量核的数量可以动态优化计算,并且非常擅长处理典型的使用 AI 的工作负载、用于训练神经网络和数据分析的矩阵乘法。
  3. 提供高保真渲染的 RT(光线追踪)核心数量。
    顺便说一句,NVIDIA 并不总是指出 CUDA、RT 和张量核心的确切数量。为了进行比较,我们使用了第三方来源的数据。
  4. 记忆。
  5. 内存带宽。这两点在逻辑上会影响显卡的性能。
  6. 支持 VDI 虚拟 GPU。这一点很重要,因为我们的客户经常使用 VDI。
  7. 能源消耗。这对我们来说是一种时尚:对于数据中心来说,这个指标在选择机箱、服务器电源和机架时很重要。

    对于 RTX Ax000 系列,性能几乎随型号指数的增长呈线性增长。

    A16是四显卡合一。NVIDIA 将该设备定位为专用的 VDI 解决方案。

    乍一看,A30 的生产力不如 A10,但 HBM2 内存类型的带宽更大。NVIDIA 将 A30 定位为 AI 解决方案。对于这两种设备,该公司没有公布张量和其他核心数量的数据(从第三方来源获得的特征)。

    对比表中其他显卡,顶级PCIe A100方案显存带宽最大,张量核数最大,在意料之中。显然,这个 GPU 的主要目的是处理人工智能和复杂的计算。这是迄今为止 NVIDIA 产品线中性能最高的显卡,尤其是 SXM 外形尺寸的 80GB 版本。但后者是焊接在板上的,出于统一的原因,我们只考虑了 PCIe 外形尺寸中的选项。


    英伟达 A4000。

    要花多少钱

    按照已经明确的组件选择公式,考虑价格。在2021年很难写到它们,因为芯片危机和持续的供应中断而被人们铭记。

    由于两个原因,将没有确切的数字。首先,它是商业机密。其次,也是最重要的,自从这些卡在春季发布以来,价格已经发生了变化(我相信它们将来会继续变化)。

    我们将使用这种方法:我们将以 GPU A5000 为标准——它在比较表中的价格将等于 1 只“鹦鹉”。我将通过与 A5000 价格的比率来介绍其余卡的价格。A10 和 A16 的价格范围很接近,因此它们的“成本”相同。
    在这个阶段,价格和申报特性的比率是可以预期的。第一个被添加到 Selectel 视频卡系列中作为初级模型角色的候选者是 A2000。同样令人感兴趣的是 A5000、A10 和 A16 之间的平价。

  8. 我们的 GPU 的底部。

    让我们继续测试申请人的表现。

    显卡测试

    进行设备测试是 Selectel 的常见做法。我们在各种公司产品中使用了大量的硬件,因此我们测试了它们之间的兼容性和软件的兼容性,以及性能。

    为此,我们拥有自己的“实验室”  我们甚至提供一些设备给客户在他们的项目中免费测试。从最近的例子来看:我们正在测试一个真正的怪物,它有 8 个同名显卡

    为了测试新显卡,我们组装了测试服务器,配备两个来自英特尔的强大处理器和足够的 RAM。

  9. 这是用于测试的服务器之一。

    特点如下:

    • 2 × Intel® Xeon® Gold 6240:18 核 @ 2.6 GHz
    • 192-384 GB DDR4;
    • 240-480 GB SSD SATA;
    • 1 × 选定的 GPU

    我们选择的基准:

    GeekBench 5 是模拟任务执行并确定 GPU 性能的通用基准。

    AI-benchmark 是一项性能测试,用于衡量学习速度并将各种神经网络应用于识别和分类任务。

    V-Ray Benchmark 是一项检查渲染速度的测试。

    ffmpeg NVENC  - 视频转码的性能测试。

    测试结果列于表中。我们为每个项目确定了领导者。

    在撰写本文时,我们手头没有 A16 和 RTX A6000 显卡,因此它们不包含在表中。他们的基准是稍后计划的。

    基准领导者

    从测试结果来看,A5000在性价比方面胜出。OpenCL Compute Score 中的最佳结果略逊于 CUDA Compute Score 中更昂贵的 A40 和 A100,适用于处理图形。在 A100 之后的 AI 基准测试中排名第二。V-Ray渲染速度测试领先,转码测试领先。支持 VDI。如果与价格表相比,我们无条件地选择。

    A2000 比 A5000 便宜五倍,同时显示基本模型可接受的基准测试结果。不支持 VDI,但适用于图形和 AI 任务。

    A4000 在性能方面介于 A2000 和 A5000 之间,不支持 VDI,但在价格和基准测试结果方面经受住了批评。

    正如我已经写过的,A100 在人工智能、模型训练、推理、数据分析和复杂计算方面是无可争议的领导者。远程桌面基础架构的理想选择。

    在比较基准和价格时,其余的 GPU 显示的结果较少。

客户热线:037125966675

客户服务中心
云产品 服务器 合 作                  Skype