在智能时代,数据的价值已经被重新定义。无论是千行百业的数字化转型,还是元宇宙、XR背后的虚拟世界,都离不开庞大数据量的采集和处理,多元化的应用场景使得传统的加速计算方式难以满足复杂需求。在德国汉堡举行的ISC 2023国际超算大会上,NVIDIA发布了一系列关于高效节能超级计算和量子计算的最新进展,包括一台由NVIDIA CPU加速的新超级计算机“Isambard 3”,以及与罗尔斯·罗伊斯公司喷气发动机设计组合作的量子计算突破。
如今,有越来越多的超级计算机采用了Arm架构的处理器,甚至闯入了TOP500的前列。部署在英国布里斯托和巴斯科学园的Isambard 3,是英国GW4科研联盟的一部分,该项目由布里斯托大学、巴斯大学、卡迪夫大学和埃克塞特大学牵头。Isambard 3搭载了384颗基于Arm架构的NVIDIA Grace CPU超级芯片,用于推动医学和科学研究,其性能和能效预计将达到Isambard 2的六倍,使其成为欧洲最节能的系统之一。该超算的FP64峰值性能达到约2.7 petaflops,功耗低于270千瓦,跻身世界三大最环保的非加速超级计算机之列。
NVIDIA Grace CPU由两个CPU芯片组成,它们之间通过NVLink-C2C互连,NVLink-C2C是一种新型的高速、低延迟、芯片到芯片的互连技术。Grace CPU是由CPU-GPU集成的“Grace Hopper超级芯片”的模块,与基于NVIDIA Hopper架构的GPU一同应用于大型HPC和AI应用。该芯片专为提供最高的性能而打造,能够在单个插座(socket)中容纳144个Arm核心。根据NVIDIA实验室使用同类编译器估算,这一结果较当前DGX A100搭载的双CPU相比高1.5倍以上。Grace CPU还提供了能效和内存带宽,其依托带有纠错码的LPDDR5x内存组成的创新的内存子系统,可实现速度和功耗的最佳平衡。LPDDR5x内存子系统提供两倍于传统DDR5设计的带宽,可达到每秒1TB ,功耗大幅降低 ,CPU加内存整体功耗仅500瓦。
英国科研联盟GW4打造能效提升6倍的超级计算机,用于气候科学、医学研究等领域
NVIDIA超大规模与高性能计算副总裁Ian Buck表示:“随着气候变化成为一个日益严峻的问题,计算机采用节能技术至关重要。NVIDIA正在与Arm Neoverse生态系统合作,为打造更节能的超级计算中心铺平道路,推动科学和工业研究取得重大突破。”由HPE建设的Isambard 3将助力欧洲科研界在人工智能、生命科学、医学、天体物理学和生物技术方面取得突破,其能够创建风电场和聚变反应堆等超复杂结构的详细模型,帮助科研人员在清洁能源和绿色能源方面取得新进展。
Arm高级副总裁兼基础设施总经理Mohamed Awad表示:“从气候变化到医学,超级计算已经使学术和行业领导者能够应对世界上一些最重大的挑战。在重要的研究领域进行拓展需要Arm Neoverse独特的性能和能效。通过与NVIDIA合作,我们为能够在Isambard 3超级计算机中满足这种需求而感到自豪。”
NVIDIA基于Arm架构的由NVIDIA Grace驱动的系统将延续Isambard 2的分子机制模拟工作,以更好地了解帕金森病,并为骨质疏松症和COVID-19寻找新的治疗方法。这些计算密集型应用受益于Grace超级芯片中提供的最高性能的核心、最高的内存带宽和最优的单核内存容量。
Isambard项目首席研究员、布里斯托大学高性能计算教授Simon McIntosh-Smith表示:“Isambard 3的应用性能效率高达其前代的6倍,媲美全球超级计算机500强中排名前50的超级计算机,将为科学家提供革命性的全新超级计算平台,以推进科研工作取得突破。基于Arm架构的NVIDIA Grace CPU具有突破性的能效,能够突破科学发现的界限,从而解决人类面临的一些最困难挑战。”
据了解,Isambard 3在2024年春季投入使用后,布里斯托大学预计注册用户数量将大幅超过当前的800人。另有消息称,瑞士国家超算中心和美国洛斯阿拉莫斯国家实验室正在建造配备GPU的超级计算机。
瑞士国家超算中心的超级计算机
美国洛斯阿拉莫斯国家实验室的超级计算机
在量子计算领域,NVIDIA、罗尔斯罗伊斯和量子软件公司Classiq公布了一项新突破,进一步提升了喷气发动机的效率。通过采用NVIDIA的量子计算平台,两家公司设计并模拟了世界上最大的计算流体力学(CFD)量子计算电路,该电路测量深度为1000万层,有39个量子位。罗尔斯罗伊斯正在使用GPU为量子未来做准备,尽管当今的量子计算机仅能支持只有几层的电路深度。罗尔斯罗伊斯致力于建造最先进的喷气发动机,以更加可持续的航空设备推动能源转型。该公司计划使用新的电路发挥量子在CFD中的优势,同时使用经典和量子计算方法来模拟喷气发动机设计的性能。
全球最大的工业模拟量子电路将推动航空领域量子计算的发展
罗尔斯罗伊斯及其合作伙伴——以色列公司Classiq先是使用Classiq的合成引擎设计了该电路,然后使用NVIDIA A100 TensorCore GPU对其进行模拟,而NVIDIA cuQuantum——一个包含经过优化、用于加快量子计算流程的库和工具软件开发工具套件保证了该流程的速度和规模。
自20世纪八十年代以来,量子计算就不断受到关注,相关数据显示,开发量子软件的大型组织数量从2018年的1%增长至2021年的30%,预计未来几年的商业成熟度会更继续提升,到2024年全球70%的大公司将开发量子计算机软件。创立于2020年的Classiq是一家位于以色列的量子算法设计平台提供商,此前曾获得了超过千万美元的融资。Classiq提供的量子算法设计平台,允许开发人员使用功能模型设计量子电路,可以在该平台搜索包含数百万个电路配置的解决方案空间,以找到符合资源要求、设计者提供的目标硬件平台。
NVIDIA提供了一个加快各学科量子研究和开发突破的统一计算平台,Grace Hopper超级芯片集NVIDIA Hopper架构GPU的性能与NVIDIA Grace CPU的多功能性于一身,可以满足超大规模量子模拟工作负载。此外,高速、低延迟的NVIDIA NVLink-C2C互连技术优化了使用该超级芯片构建的经典系统与量子处理器或QPU的连接。Grace Hopper每个节点共有600GB快速访问内存,使得量子生态系统能够进一步扩大这些模拟的规模。
GPU加速量子计算系统DGX Quantum的背后,就是Grace Hopper提供了有力的支撑,同时,NVIDIA还为开发者提供了一个连接GPU和QPU的强大开源编程模型——NVIDIA CUDA Quantum。集成CUDA Quantum的最新QPU制造商ORCA Computing正在将其光子量子计算机与用于机器学习的GPU相结合。两个热门量子机器学习框架TensorFlow Quantum和TorchQuantum现在也集成了cuQuantum。除此之外,NVIDIA GPU之上的“量子故事”,还在持续上演。
欧洲最大的量子计算设施之——于利希超级计算中心也在ISC上宣布,计划与NVIDIA共同建立一座量子计算实验室,该实验室将将与慕尼黑的ParTec AG一起在NVIDIA量子计算平台的基础上开发一台经典-量子超级计算机,使用CUDA Quantum等工具帮助开发者推动了量子计算领域的发展。
这项重大合作将推动在NVIDIA 加速的系统上运行高性能计算和量子计算工作负载的研究
该实验室将由欧洲最大的跨学科研究中心之一——德国于利希研究中心(FZJ)运营,并作为于利希量子计算用户基础设施(JUNIQ)的一部分,运行高性能、低延迟的量子-经典计算工作负载。JUNIQ正在使用搭载3744颗NVIDIA A100 Tensor Core GPU的JUWELS加速系统进行量子计算模拟。
JSC量子信息处理部主管Kristel Michielsen表示:“混合量子-经典系统正在使量子计算更接近现实,以解决单靠经典计算无法解决的复杂问题。通过与NVIDIA合作建立这座模块化量子计算实验室,JSC的研究人员可以在化学和材料科学领域取得前所未有的进步,推动各个科学学科和行业实现更加广泛的变革性进展。”
NVIDIA量子计算平台通过开源CUDA Quantum编程模型实现了量子与经典计算的紧密集成,并通过NVIDIA cuQuantum软件开发套件实现了一流的模拟。JSC计划采用分阶段的方式测试该系统,使用NVIDIA CUDA量子编程模型对量子处理器进行编程并将其集成到于利希超大规模模块化超级计算架构中。
ParTec AG首席执行官Bernhard Frohwitter表示:“ParTec长期以来一直在推动模块化超级计算架构的开发,并通过领先的ParaStation Modulo软件实现了混合模块化计算。量子计算机将成为未来任何异构超级计算机必不可少的组成部分。此次合作将带来新的可能性。”