NVIDIA创六项人工智能性能记录

2024.06.30

    Tensor Core GPU在每一项MLPerf基准测试结果中均实现最佳表现；用户可通过NGC使用加速堆栈。
    在最新公布的业内首套人工智能基准测试中，NVIDIA创下6项人工智能性能记录。
    在谷歌、英特尔、百度、NVIDIA及其他数十家科技行业领军企业的支持下，新型基准测试套件MLPerf可测定一系列深度学习工作负载。该套件涵盖了计算机视觉、语言翻译、个性化推荐以及强化学习任务等领域，旨在成为业内首个客观的人工智能基准测试套件。
    最佳性能表现
    NVIDIA在其提交的 6个 MLPerf 基准测试结果中均取得了最佳表现。这些测试涵盖了多种工作负载和基础架构规模 – 从单节点上的16颗GPU到跨80节点上的多达640颗GPU。
    这些测试分为6大类别，分别为图像分类、对象实例分割、目标检测、临时翻译、复发性翻译与推荐系统。NVIDIA并未提交第7类别，即强化学习的基准测试，原因是该类别尚未充分利用到GPU加速。
    NVIDIA在语言翻译测试类别中表现突出
    NVIDIA在语言翻译这一关键基准测试类别中表现尤为出色，仅需 6．2 分钟即完成了Transformer 神经网络的训练。关于NVIDIA参与的6项基准测试结果的更多信息，请访问NVIDIA开发者新闻中心。
    NVIDIA工程师利用NVIDIA DGX系统实现了这些测试结果。该系统包括全球最强大的人工智能系统NVIDIA DGX－2，搭载了16颗完全连接的V100 Tensor Core GPU。
    唯一一家参与多达6项基准测试的科技公司
    NVIDIA是唯一一家参与多达6项基准测试的科技公司，充分展现出V100 Tensor Core GPU在部署人工智能工作负载方面的通用性。
    NVIDIA副总裁兼加速计算总经理Ian Buck表示：“全新基准MLPerf展示了NVIDIA Tensor Core GPU非凡的性能与通用性。我们的Tensor Core GPU拥有高性价比，且可通过各地的云服务提供商及电脑制造商实现供货，进而帮助世界各地的开发人员在开发过程中的每一个阶段推进人工智能的应用。”
    一流的人工智能计算需要“全栈式”创新
    要想在复杂多样的计算工作负载中实现优异性能，不仅仅需要出色的芯片。加速计算也不单单与加速器有关，还需要实现全堆栈创新。
    NVIDIA堆栈包括NVIDIA Tensor Cores、NVLink、NVSwitch、DGX系统、CUDA、cuDNN、NCCL、经过优化的深度学习框架容器以及NVIDIA软件开发套件。
    超高易用性
    NVIDIA的人工智能平台是最便捷且高性价比的选择。Tensor Core GPU可通过各地的云服务提供商及电脑制造商实现供货。
    高性价比的选择
    借助售价仅为2，500美元的超强桌面级GPU － NVIDIA TITAN RTX，用户在桌面上也可实现相同的Tensor Core GPU强大功能。如果按照3年使用期来计算，该GPU每小时的费用仅相当于几美分。
    通过NVIDIA GPU Cloud （NGC）云容器注册，用户可持续更新这些软件的加速堆栈。