该加速器专为要求最严苛的计算任务而设计,结合了 24 GB 内存和极快的内存带宽以及适用于单精度和双精度工作负载的领先计算性能。配备最新的 NVIDIA GPU Boost™ 技术,Tesla K80 可智能监控 GPU 使用情况,以最大限度地提高吞吐量1,并且性能比 CPU 高 10x2。
美国GPU显卡服务器
Nvidia Tesla K80 GPU 特性
动态并行
启用 GPU 线程以自动生成新线程。通过在不返回 GPU 的情况下适应数据,这大大简化了并行编程。
超Q
允许多个 CPU 内核在单个或多个基于 Kepler 的 GPU 上同时使用 CUDA 内核。这极大地提高了 GPU 利用率,简化了编程,并减少了 CPU 空闲时间。
系统监控
将 GPU 子系统与主机系统的监控和管理功能集成,例如 IPMI 或 OEM 专有工具。IT 人员现在可以使用广泛使用的集群/网格管理解决方案来管理计算系统中的 GPU 处理器。
L1 和 L2 缓存
加速算法,如物理解算器、光线追踪和稀疏矩阵乘法,其中数据地址事先未知。
内存错误保护
满足数据中心和超级计算中心对计算精度和可靠性的关键要求。Tesla K80 和 K40 中的外部和内部存储器均受 ECC 保护。
使用双 DMA 引擎的异步传输
通过在计算核心处理其他数据的同时通过 PCIe 总线传输数据来提高系统性能。
GPU 加速
使最终用户能够将功率余量转换为更高的时钟,并为各种 HPC 工作负载实现更大的加速。
动态扩展 GPU 时钟
动态扩展 GPU 时钟以获得最大的应用程序性能和更高的能效。
灵活的编程环境,广泛支持编程语言和 API
提供选择 OpenACC、C、C++ 或 Fortran 的 CUDA 工具包的自由,以表达应用程序并行性并利用创新的 Kepler 架构。
2x 共享内存和 2x 寄存器文件
与 K40 相比,通过 2 倍的共享内存和 2 倍的寄存器文件提高了有效吞吐量和带宽。
零功耗空闲
在运行传统的非加速工作负载时,通过关闭空闲 GPU 来提高数据中心的能源效率。