当下人工智能领域的流量担当,毫无疑问是ChatGPT。它不仅可像朋友一样跟你聊天,甚至还能帮你写代码、改剧本····仅上线2个多月,ChatGPT的月活跃用户已过亿,刷新纪录。
随着ChatGPT爆火,国内外知名IT企业纷纷加入这场人工智能竞赛,而现象级AI应用背后,则带来庞大的AI算力需求与挑战。中科曙光方面表示,截止2月13日,曙光智算公司提供用于AI训练与推理计算的试用资源,在开放使用后一周内已被抢注一空,通常情况下,这些计算资源要三个月左右才能被用户注册并使用。目前,曙光智算正协调多个计算中心,提供更多算力资源满足用户需求。
据报道,ChatGPT等AI模型的训练与内容生成与“大算力”的支持密不可分,早在2020年5月,GPT-3的模型参数量就已达1750亿,训练该模型花费的硬件相关投入超1700万美元。
为降低AI大模型的训练与推理成本, 曙光在2019年就开始布局AI算力服务,通过遍布全国海量异构计算资源与统一调度服务体系,实现面向全国AI用户的算力供应,让用户无需投入大量成本购买硬件设施也可完成AI大模型的训练与推理工作。
除能够在线提供Tensorflow、PyTroch、PaddlePaddle等主流AI框架外,曙光针对大模型的分布式训练持续优化,率先实现在数千节点规模时仍能满足高效训练目标。
如今,曙光已与百度、复旦大学等企业及科研院所深度合作,形成了诸多基于AI模型的联合解决方案,攻克类脑智能、基因技术、自动驾驶等多个前沿领域AI难题,帮助AI模型快速走向规模化应用。