NVIDIA显卡刷新训练纪录 11分钟完成GPT-3大语言模型训练-3809游略网

在AI领域热度持续升温的背景下，NVIDIA的显卡日益受到青睐，特别是高端的H100加速卡，售价达到超过25万元亦难以满足市场需求。其强大的性能在最新的AI测试中表现出色，刷新了基于GPT-3的大语言模型训练任务的纪录至11分钟。机器学习和人工智能领域的开放产业联盟MLCommons发布了最新的MLPerf基准评测。此次评测涵盖了8个负载测试，包括基于GPT-3开源模型的LLM大语言模型，这是对AI平台性能的重要考验。参加测试的由896个Intel至强8462Y+处理器和3584个H100加速卡组成的NVIDIA平台表现出色，不仅成功完成了全部测试，并且刷新了记录。在关键的GPT-3大语言模型训练任务中，NVIDIA平台只用了10.94分钟，这是一个值得关注的数字。以使用96个Intel至强8380处理器和96个Habana Gaudi2 AI芯片的平台为比较，须时311.94分钟才能完成同样的测试。即使规模相差悬殊，只用768个H100加速卡的NVIDIA平台的训练时间也只需45.6分钟，依然远超对标平台。 NVIDIA H100显卡規格强大，采用定制版台积电4nm工艺制造的GH100 GPU核心，包含800个晶体管，整合了18432个CUDA核心、576个张量核心和60MB二级缓存。充分支持6144-bit HBM高带宽内存和PCIe 5.0的技术。此外，H100计算卡同时有SXM和PCIe 5.0两种样式，相应版本的CUDA核心和张量核心数量也有不同，功耗最高能达到700W。其综合运算性能相较于前代产品A100有了显著提升。

NVIDIA显卡刷新训练纪录,11分钟完成GPT-3大语言模型训练