在高性能计算HPC、AI市场上,Intel再一次发力,该公司GPU业务副总Jeff McVeigh今天通过公司博客介绍了Intel当前产品及未来产品的进展,其中一个重要内容就是调整了原定2023年问世的产品,现在直接开发2025年的XPU,代号Falcon Shores。
Intel当前的高性能GPU中,用于AI及HPC计算的是Ponte Vecchio,用于虚拟、云加速市场的是Arcitic Sond M,按照之前的规划,它们应该在今年被Rialto Bridge和Lancaster Sound系列新品取代。
Intel最新的路线图中,Jeff McVeigh宣布停止这两款产品的开发,直接开发下一代的产品,也就是代号“Falcon Shores”(猎鹰海岸)的XPU,2025年推出,采用基于chiplet芯粒灵活架构,以满足呈指数级增长的科学计算和AI计算需求。
Intel正在研究该架构的不同版本,以支持AI、科学计算和两者融合的市场需求。
这个基础性架构非常灵活,可以随着时间的推移集成Intel和客户的新IP(包括CPU内核和其它芯粒),使用Intel IDM 2.0模式制造。
Flex系列产品也以两年为推出周期,Melville Sound将成为Intel Flex系列的下一代产品,实现在性能,功能和工作负载方面的重大架构飞跃。
“Falcon Shores”去年底的ISC超算大会上正式公布,它不是简单的CPU或者GPU,而是被Intel称为XPU,可以按需配置不同区块模块, x86 CPU核心、Xe GPU核心整合在一个芯片内,随意搭配,数量和比例都非常灵活。
它会采用埃米级制造工艺(Intel 20A/18A,后者可能性更大),辅以下一代先进封装技术,具备极高的共享内存带宽、业界领先的IO输入输出,还可以大大简化编程模型。
按照Intel给出的数字,对比当今水平,Falcon Shores的能耗比提升超过5倍,x86计算密度提升超过5倍,内存容量与密度提升超过5倍。
Intel还介绍了当前的至强及Max系列GPU的应用情况,如下所示:
客户应用:
Intel数据中心领域的至强和Max系列产品,在早期的工作中已经得到客户的好评。
Intel数据中心GPU Flex系列:Intel数据中心GPU Flex系列凭借硬件方面的独特优势以及对于开放软件生态系统的投入,在国内已通过搭载新华三、宁畅、宝德、超聚变等众多OEM合作伙伴的系统陆续面市,同时在当虹科技、中科大洋、火山引擎、亿联网络等行业合作伙伴的实际使用场景中实现了针对不同视觉云工作负载的应用部署落地,在此过程中也获得了来自中国联通、天翼云、移动云的电信运营商的支持,整体生态呈现良好增长势头。
性能表现:
Intel数据中心GPU Flex系列:
Intel数据中心GPU Flex系列可以灵活处理媒体处理与传输、云游戏、AI推理、VDI多种云工作负载,有效优化使用者的总体拥有成本。
Flex系列GPU可满足图像质量、部署密度和时延方面的要求。
在集成了基于硬件的、业界领先的AV1编码器的基础上,Flex系列数据中心GPU可以提供更出色的媒体转码吞吐性能和解码吞吐性能,且能耗低于同类型解决方案。
它还实现了30%以上的带宽增幅。
Intel数据中心GPU Max系列:
Max系列GPU是Intel迄今为止最复杂的处理器,采用了先进的制造工艺,支持光线追踪、Rambo缓存以及用于AI的深度脉动阵列等。
据客户反馈,Max系列GPU在材料科学、宇宙学和等离子体物理相关代码方面的实际应用中,有相较于同类领先GPU 30-260%的加速优势。
Intel还在开发比肩NVIDIA A100的数据中心产品。
正如Jeff在博客中指出的那样,在材料科学、宇宙学和等离子体物理相关代码方面的实际应用中,有相较于同类领先GPU(来自NVIDIA)30%到260%的加速优势。