7月6日-8日,2023世界人工智能大会(WAIC 2023)在上海举办,大会主题“智联世界 生成未来”直截明了地给出了今年最热门的话题——生成式人工智能
。而它的技术基础——大模型也成为今年以来最热门的科技话题,可能没有之一。根据大会官方数据,今年有超过400家企业参展,比去年接近翻番,比前年多了 1/3。
要说这届人工智能大会谁最风光,华为如果说第二,恐怕没人敢认第一。如何直观感受华为在WAIC 2023的影响力,只需看看它的展台:面积约等于百度展台+腾讯展台+阿里巴巴展台。
7月6日,世界人工智能大会开幕当天,“华为云盘古登上《Nature》正刊”的新闻登上热搜。一句话总结它的意义:这是中国科技公司近十年首篇作为唯一署名单位发表的《Nature》正刊论文。
7月7日,华为发布盘古大模型3.0,前一天登上《Nature》的“华为云盘古”正是盘古大模型。
虽然外界没能等来“华为Chat”“盘古Chat”,但华为却为大模型的真正落地提供了新的范式。
盘古大模型3.0是什么?
据不完全统计,截至目前国内至少超过20家互联网大厂公布或发布了自己的大模型,包括但不限于百度、腾讯、阿里巴巴、华为、小米、360等。
但似乎就像造电车不对标特斯拉就不能彰显自己的技术一样,在大部分已公布的大模型中,都喜欢把ChatGPT作为对标,比如百度的“文心一言”,阿里巴巴的“通义千问”。虽然他们在推广自己的产品时,大多也会强调其B端能力,但真正落地商用化还迟迟没有到来。当然,华为除外。
和ChatGPT完全不同,华为盘古3.0从立项之初针对的就是工业和科学领域。
具体来说,2021年华为开始立项做盘古大模型,并在当年4月发布了盘古NLP(自然语言)大模型、盘古CV(视觉)大模型、盘古科学计算大模型;2021年9月,推出用于药物研发细分场景的大模型。这是盘古大模型1.0。
2022年,盘古大模型2.0发布。华为与能源集团合作发布了盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型,开始将大模型初步应用于企业、工业和科学研究。
7月7日发布的盘古大模型3.0则更进一步,不仅模型参数更大,针对的行业也更多,更具有实用性。华为云CEO张平安表示,盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构。
其中,L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求;
L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型;
L2层为客户提供了更多细化场景的模型,主要专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。
华为大模型实力几许?
从盘古大模型的发展历程也能看出一点,华为对大模型的商业化探索从开发之初起,立足点就一直在B端市场。
对于这轮人工智能浪潮,华为创始人任正非也曾作出自己的判断,“未来在AI大模型方面会风起云涌,不只是微软一家。人工智能软件平台公司对人类社会的直接贡献可能不到2%,98%都是对工业社会、农业社会的促进。”
这段话也可以解释为何华为不执着于“华为Chat”,而是坚定走自己的工业大模型之路。
并且和其他采用英伟达等外部算力提供商的方案不同,华为大模型的算力基础来自自己的昇腾计算平台——昇腾910和昇腾310处理器。其中昇腾910发布于2019年8月,华为称同等功耗下其算力是英伟达V100芯片(英伟达A100上一代产品)的两倍。并且,昇腾计算不仅是华为盘古大模型的基础,也可外供。
华为轮值董事长胡厚崑在7月6日的2023世界人工智能大会上表示,目前华为已经孵化了20多个基础大模型,适配了10多个业界主流大模型,“当前中国的大模型中有一半的是由AI昇腾算力来支持的”。例如科大讯飞的星火大模型。
华为昇腾计算业务CTO周斌前不久也表示,昇腾AI基础软硬件平台已可承载ChatGPT或GPT-4的算力需求,实现了20倍模型压缩、1%精度损失、推理时延小于50ms能力。
任正非曾表示,模型的应用有时比模型本身还有前途,华为会做AI的底层算力平台,但应用平台不是华为的选项,“在2%的平台贡献里,我们占一点点就行。ChatGPT对我们的机会是什么?它会把计算撑大,把管道流量撑大,这样我们的产品就有市场需求。”
既研发大模型,也掌握底层的算力平台,等于华为既要做英伟达,也要做OpenAI——当然,主要是工业和科学领域。在美国对华芯片政策日益严苛的情况下,华为的做法显然更安全可控,并且有利可图。
华为昇腾计算业务总裁张迪煊在接受采访时也把美国禁售英伟达A100等GPU视作华为昇腾计算的机会,“现在国内算力需求旺盛,许多大厂能拿到算力,但许多小企业拿不到”。言外之意是,许多小企业需要昇腾,但大厂很多都避开了华为。例如今年6月就有消息称,字节跳动向英伟达订购了价值近10亿美元的GPU。
尽管字节跳动也许是出于性能的考虑而选择了英伟达,但对那些实力强大且可能与华为存在竞争的大模型来说,又当裁判又做运动员的华为,可能会引发其他大厂的忌惮。
不过,不管怎样,和其他停留在“计划”“PPT”“演示”里的大模型相比,华为将大模型的商业化又往前推进了一大步,并且验证了其可行性。对还处于商业化探索期的ChatGPT,以及国内众多类似大模型而言,这都是一次宝贵经验。
AI大模型势不可当
和曾经“深度赋能传统行业”的互联网“黑话”一样,大模型已然成为一门显学。虽然互联网黑话褒贬不一,但如今已没人怀疑互联网对各行各业的改造,无数企业转型数字化无疑证明了它的影响力。现在,大模型被普遍视为下一个互联网,无数大佬为其摇旗呐喊,盛况空前。
李彦宏说大模型将渗透更多领域,重构全球数字化产业;周鸿祎说大模型不是风口和泡沫,将引领新工业革命;雷军说AI大模型带来的革命正扑面而来……
在本届世界人工智能大会上,国家标准委指导的国家人工智能标准化总体组宣布,我国首个大模型标准化专题组组长,将由上海人工智能实验室与百度、华为、阿里、360 集团、科大讯飞、中国移动研究院等企业联合担任,并正式启动大模型测试国家标准制定。
1889年,巴黎举办世博会。博览会上最引人注目的展品是高320米、重9000吨、由18000多个钢制构件和数百万个铆钉组装而成的埃菲尔铁塔。后来历史书上写,“埃菲尔铁塔成为席卷世界的第二次工业革命的象征”。
或许很多年后我们再看今天的世界人工智能大会,也发现它也成为了一个时代的印迹。