在全球大厂中,百度第一个做出了对标ChatGPT的AI产品——文心一言。就在前两天,OpenAI忽然出人意料地官宣了多模态大模型GPT4.0,震惊全世界。这个时间上的巧合,让人们对于今天文心一言的出场,更是期待值拉满了。3月16日下午2点,万众瞩目的邀请测试展示如期召开。一上来,李彦宏就直言,文心一言对标ChatGPT,但不能叫完美。但因为有市场需求,所有人都在等着百度发布这个技术。现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。
首先,李彦宏就考验了文心一言《三体》作者是谁。(理由是大刘也是山西阳泉人,是他的老乡)紧接着,文心一言总结了《三体》核心内容,条理分明地列出了3大点,并且还给出了5个续写的角度,下一个刘慈欣可能就是你了。然后,对于「于和伟和张鲁一有哪些共同点」、「于和伟和张鲁一谁更高」这两个问题,文心一言基于推理能力得出了正确答案。在商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。在连续3次内容创作生成中,文心一言既能准确理解人类意图,又能清晰地表达,这是基于庞大数据规模而发生的「智能涌现」。李彦宏称,「这些训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。」那文心一言在完成数学推演及逻辑推理等复杂任务时的表现如何呢?让我们看看它会不会解鸡兔同笼问题。下面演示可以看出,文心一言能理解题意,还有正确的解题思路,可以像学生做题一样,按正确的步骤,一步步算出正确答案。此外,文心一言具备中文领域最先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。在现场展示中,文心一言正确解释了成语「洛阳纸贵」的含义、「洛阳纸贵」对应的经济学理论,还用「洛阳纸贵」四个字创作了一首藏头诗。当然了,文心一言在英文理解方面能力还不是很好,因为训练数据比较少,这也是接下来文心一言要努力的方向。在多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。比如,让文心一言为2023世界智能交通大会创作一张海报。有趣的是,文心一言还能根据内容生成四川话等方言的语音。然而由于视频生成能力成本较高,现阶段还未对所有用户开放。有大佬评论道,在GPT-4发布后的第一天,不论是谁发布类似的产品,似乎都变得索然无味了。
整体来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但目前还远未到发展完善的阶段,还有赖于通过真实的用户反馈而逐步迭代。百度CTO王海峰表示,文心一言,是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。其中,前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。李彦宏表示,「文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,效果会迅速提升,给你『士别三日,当刮目相看』的惊喜。」全球大厂都在冲刺对标ChatGPT产品,为什么百度拿下了第一?李彦宏的话,解答了我们的疑问:「无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。」可以说,文心一言是百度过去多年努力的延续,百度早已在深度计算领域深耕多年。早在2012年,百度就注意到了深度学习的风向。2013年,百度建立了中国第一个深度学习研究院(IDL)。2016年,百度开源首个国产深度学习框架PaddlePaddle(飞桨),而飞桨是国内至今唯一能与TensorFlow 和 PyTorch两大主流框架正面交锋的深度学习框架。目前,飞桨已经凝聚了535万开发者,创建了67万个模型,构建起一个繁荣的深度学习生态。而2020年,当GPT-3出现后,百度就更加开始加注大模型。2021年,百度发布了百亿参数中英双语大模型PLATO-X、千亿参数大模型「鹏城-百度·文心」,2022年,又发布了知识增强大模型Ernie 3.0。在研发上,百度也是毫不吝啬,在过去十年里的研发投入已经达到了1000亿。其中核心研发投入占核心收入比例连续8个季度超过了20%。据统计,百度在2020年的研发投入强度为18.22%,位列民营企业500强第一。2021年为20.03%,位列民营企业500强第二。在本周一,微软特意在官博上自曝,自己耗资数亿美元,用了英伟达数万颗A100,才在Azure云服务中,造出了符合OpenAI要求的超级计算机。同样,在AI国内赛中,云计算需求激增,而百度智能云也很早就开始在云上布局AI。在2012年,百度就在李彦宏的老家山西阳泉建了一个计算中心,包含「冰山」冷存储服务器和X-MAN超级AI计算平台等自研计算系统,每秒可以完成2000万亿次深度神经网络计算。而在2022年12月底,百度将其正式升级为「智算中心」,对外提供智算需求服务。现在,百度智算中心可以在千卡并行环境下可以实现加速比90%,做到单机群万卡规模,有效支持大规模训练场景,算力可达4EFLOPS。文心一言如何定位?
百度认为,文心一言是一个通用的赋能平台,金融、能源、媒体、政务等千行百业,都可以基于这个平台来实现智能化变革,实现效率提升,创造巨大的商业价值。它超强的自然语言理解和表达能力,可以让任何公司都有机会离自己的客户更近,去创建最好的客户体验。自2月份百度官宣「文心一言」以来,已有超过650家企业宣布接入文心一言生态。另外,文心一言对个人也会有巨大的改变。有机构预测,到2030年,人工智能可以将每一个知识工作者的生产力提高4倍以上。很显然,我们中很多人的工作性质,会发生不可逆转的改变。在李彦宏看来,生成式AI会催生新产品、新业态,乃至很多的创业和投资机会。而对大部分企业来说,所谓的机会并不是从头做ChatGPT这类大模型,这既不现实,也不经济。而真正的机会应该是,基于通用大语言模型,抢先开发重要的应用服务。就好比移动互联网时代,最成功的商业产品不见得是安卓和IOS,而是基于安卓和IOS开发的微信、淘宝、抖音等应用。李彦宏在现场预测到,大模型时代将产生三大产业机会。第一类是新型云计算公司,主流商业模式从IaaS变为MaaS。以前,企业选择云厂商,更多看算力、存储等基础云服务。而在未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同。第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业Know how,调用通用大模型能力,为行业客户提供解决方案。而文心大模型,已经在电力、金融、媒体等领域,发布了10多个行业大模型。第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。今天,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,很可能就是未来的新巨头。更多的杀手级应用、现象级产品、里程碑事件,即将诞生。最后,李彦宏强调说,文心一言并不是中美科技对抗的工具,而是一代代百度技术人员追逐科技改变世界的梦想的产物,是百度服务亿万用户、赋能千行百业的全新平台,是创新驱动发展的最佳证明。对此百度表示,3月16日起,首批用户将可通过邀请测试码在官网体验产品,后续会陆续开放更多名额。企业方面,则可以通过搜索「百度智能云」进入官网,申请加入文心一言云服务测试。GDP4.0和文心一言,完全是两种不同的外向气质。一个是典型的美式英雄主义,一出场就是王炸完全的颠覆式创新,魔法级的技能让全球瞠目结舌;一个是典型的中式实用主义,没有英雄,没有浪漫,很务实的市场需求理解,把十多年的积累组合升级,一点都不酷,还显得有点生涩。
抗万钧之压,顶千夫之笑,走出这一小步,已经值得侧目。