在AI领域热度持续升温的背景下,NVIDIA的显卡日益受到青睐,特别是高端的H100加速卡,售价达到超过25万元亦难以满足市场需求。其强大的性能在最新的AI测试中表现出色,刷新了基于GPT-3的大语言模型训练任务的纪录至11分钟。 机器学习和人工智能领域的开放产业联盟MLCommons发布了最新的MLPerf基准评测。此次评测涵盖了8个负载测试,包括基于GPT-3开源模型的LLM大语言模型,这是对AI平台性能的重要考验。参加测试的由896个Intel至强8462Y+处理器和3584个H100加速卡组成的NVIDIA平台表现出色,不仅成功完成了全部测试,并且刷新了记录。 在关键的GPT-3大语言模型训练任务中,NVIDIA平台只用了10.94分钟,这是一个值得关注的数字。以使用96个Intel至强8380处理器和96个Habana Gaudi2 AI芯片的平台为比较,须时311.94分钟才能完成同样的测试。即使规模相差悬殊,只用768个H100加速卡的NVIDIA平台的训练时间也只需45.6分钟,依然远超对标平台。 NVIDIA H100显卡規格强大,采用定制版台积电4nm工艺制造的GH100 GPU核心,包含800个晶体管,整合了18432个CUDA核心、576个张量核心和60MB二级缓存。充分支持6144-bit HBM高带宽内存和PCIe 5.0的技术。此外,H100计算卡同时有SXM和PCIe 5.0两种样式,相应版本的CUDA核心和张量核心数量也有不同,功耗最高能达到700W。其综合运算性能相较于前代产品A100有了显著提升。
NVIDIA显卡刷新训练纪录 11分钟完成GPT-3大语言模型训练
本文来自网络,不代表本站立场,转载请注明出处:https: