ChatGPT全球赛开场，李彦宏已无退路，百度文心一言今日正式开始邀请测试！

公众号新闻

2023-03-16 08:03

新智元报道

编辑：编辑部

【新智元导读】ChatGPT全球赛，百度文心一言今日正式开始邀请测试！

ChatGPT国内赛，已有选手冲刺到终点了。

在全球大厂中，百度第一个做出了对标ChatGPT的AI产品——文心一言。

就在前一天，OpenAI忽然出人意料地官宣了多模态大模型GPT4.0，震惊全世界。

这个时间上的巧合，让人们对于今天文心一言的出场，更是期待值拉满了。

正式开启邀请测试

3月16日下午2点，万众瞩目的邀请测试展示如期召开。

一上来，李彦宏就直言，文心一言对标ChatGPT，但不能叫完美。但因为有市场需求，所有人都在等着百度发布这个技术。

文心一言有多强？

现场，李彦宏展示了文心一言在五个使用场景的表现，包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

文学创作

首先，李彦宏就考验了文心一言《三体》作者是谁。（理由是大刘也是山西阳泉人，是他的老乡）

文心一言准确、详细地介绍了《三体》作者刘慈欣。

紧接着，文心一言总结了《三体》核心内容，条理分明地列出了3大点，并且还给出了5个续写的角度，下一个刘慈欣可能就是你了。

然后，对于「于和伟和张鲁一有哪些共同点」、「于和伟和张鲁一谁更高」这两个问题，文心一言基于推理能力得出了正确答案。

上下滑动查看全部

商业文案创作

在商业文案创作场景中，文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。

在连续3次内容创作生成中，文心一言既能准确理解人类意图，又能清晰地表达，这是基于庞大数据规模而发生的「智能涌现」。

上下滑动查看全部

李彦宏称，「这些训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据，以及5500亿事实的知识图谱等。」

数理推算

那文心一言在完成数学推演及逻辑推理等复杂任务时的表现如何呢？让我们看看它会不会解鸡兔同笼问题。

下面演示可以看出，文心一言能理解题意，还有正确的解题思路，可以像学生做题一样，按正确的步骤，一步步算出正确答案。

中文理解

此外，文心一言具备中文领域最先进的自然语言处理能力，在中文语言和中国文化上有更好的表现。

在现场展示中，文心一言正确解释了成语「洛阳纸贵」的含义、「洛阳纸贵」对应的经济学理论，还用「洛阳纸贵」四个字创作了一首藏头诗。

当然了，文心一言在英文理解方面能力还不是很好，因为训练数据比较少，这也是接下来文心一言要努力的方向。

多模态生成

在多模态生成方面，李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。

比如，让文心一言为2023世界智能交通大会创作一张海报。

还没等几秒钟，一张赛博风格的图片就生成了。

有趣的是，文心一言还能根据内容生成四川话等方言的语音。

这还不算什么，文心一言甚至还能将一段话生成视频。

然而由于视频生成能力成本较高，现阶段还未对所有用户开放。

但遗憾的是，这些都不是实时演示……

有大佬评论道，在GPT-4发布后的第一天，不论是谁发布类似的产品，似乎都变得索然无味了。

整体来看，文心一言某种程度上具有了对人类意图的理解能力，回答的准确性、逻辑性、流畅性都逐渐接近人类水平。

但目前还远未到发展完善的阶段，还有赖于通过真实的用户反馈而逐步迭代。

百度CTO王海峰表示，文心一言，是新一代知识增强大语言模型，是在ERNIE及PLATO系列模型的基础上研发的。

它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。

其中，前三项是这类大语言模型都会采用的技术，ERNIE和PLATO中也已经有应用和积累，在文心一言中又有了进一步强化和打磨；后三项则是百度已有技术优势的再创新，也是文心一言未来越来越强大的基础。

李彦宏表示，「文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮，效果会迅速提升，给你『士别三日，当刮目相看』的惊喜。」

百度为什么是第一个？

全球大厂都在冲刺对标ChatGPT产品，为什么百度拿下了第一？

李彦宏的话，解答了我们的疑问：「无论是哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理，需要多年的坚持和积累，没法速成。」

可以说，文心一言是百度过去多年努力的延续，百度早已在深度计算领域深耕多年。

早在2012年，百度就注意到了深度学习的风向。2013年，百度建立了中国第一个深度学习研究院（IDL）。

2016年，百度开源首个国产深度学习框架PaddlePaddle（飞桨），而飞桨是国内至今唯一能与TensorFlow 和 PyTorch两大主流框架正面交锋的深度学习框架。

目前，飞桨已经凝聚了535万开发者，创建了67万个模型，构建起一个繁荣的深度学习生态。

而2020年，当GPT-3出现后，百度就更加开始加注大模型。2021年，百度发布了百亿参数中英双语大模型PLATO-X、千亿参数大模型「鹏城-百度·文心」，2022年，又发布了知识增强大模型Ernie 3.0。

上下滑动查看全部

在研发上，百度也是毫不吝啬，在过去十年里的研发投入已经达到了1000亿。

其中核心研发投入占核心收入比例连续8个季度超过了20%。

据统计，百度在2020年的研发投入强度为18.22%，位列民营企业500强第一。2021年为20.03%，位列民营企业500强第二。

在本周一，微软特意在官博上自曝，自己耗资数亿美元，用了英伟达数万颗A100，才在Azure云服务中，造出了符合OpenAI要求的超级计算机。

同样，在AI国内赛中，云计算需求激增，而百度智能云也很早就开始在云上布局AI。

在2012年，百度就在李彦宏的老家山西阳泉建了一个计算中心，包含「冰山」冷存储服务器和X-MAN超级AI计算平台等自研计算系统，每秒可以完成2000万亿次深度神经网络计算。

而在2022年12月底，百度将其正式升级为「智算中心」，对外提供智算需求服务。现在，百度智算中心可以在千卡并行环境下可以实现加速比90%，做到单机群万卡规模，有效支持大规模训练场景，算力可达4EFLOPS。

据称，文心一言也是部分在阳泉中心计算的。

四层全栈布局

人类进入人工智能时代，IT技术的技术栈发生了根本性变化过去基本分为三层：芯片层，操作系统层和应用层。而现在可以分为四层：芯片层、框架层、模型层和应用层。

今天，百度是全球为数不多、在这四层进行全栈布局的人工智能公司，从高端芯片昆仑芯，到飞桨深度学习框架，再到文心预训练大模型，到搜索、智能云、自动驾驶、小度等应用，各个层面都有领先业界的自研技术。

文心一言的训练，离不开庞大的真实数据。

现在，ERNIE 3.0每天接受数十亿次用户的搜索请求，这让文心一言能够基于一个庞大的、高效的数据池，快速地学习和改进。

百度的搜索服务，每天响应几十亿次真实的用户使用需求，每天进行1万亿次深度语义推理与匹配，能够提供最真实、最及时的反馈，从而倒逼大模型、深度学习框架和芯片的优化。

就像百度昆仑芯片之所以在AI芯片中拥有领先的性能，正是因为它已经为百度的搜索服务优化了十年。

李彦宏描述道，大模型训练堪称暴力美学，需要有大算力、大数据和大模型，每一次训练任务都耗资巨大。

而全栈布局的优势在于，可以在技术栈的四层架构中，实现端到端优化，大幅提升效率。

尤其是框架层和模型层之间很强的协同作用，可以帮助构建更高效的模型，并显著降低成本。

事实上，超大规模模型的训练和推理，给深度学习框架带来了很大考验。比如，为了支持千亿参数模型的高效分布式训练，百度飞桨专门研发了 4D 混合并行技术。

另外，芯片、框架、大模型、和终端应用场景，可以形成一个高效的反馈闭环，帮助大模型不断去调优迭代，让用户体验不断升级。

李彦宏还特别强调，目前在全球范围内，在四层架构的每一层都有领先产品的公司几乎没有，百度的优势非常独特，在后续文心的迭代速度上，我们应该会有明显感受。

文心一言如何定位？

百度认为，文心一言是一个通用的赋能平台，金融、能源、媒体、政务等千行百业，都可以基于这个平台来实现智能化变革，实现效率提升，创造巨大的商业价值。

它超强的自然语言理解和表达能力，可以让任何公司都有机会离自己的客户更近，去创建最好的客户体验。

自2月份百度官宣「文心一言」以来，已有超过650家企业宣布接入文心一言生态。

另外，文心一言对个人也会有巨大的改变。有机构预测，到2030年，人工智能可以将每一个知识工作者的生产力提高4倍以上。

很显然，我们中很多人的工作性质，会发生不可逆转的改变。

催生哪些新机会？

在李彦宏看来，生成式AI会催生新产品、新业态，乃至很多的创业和投资机会。

而对大部分企业来说，所谓的机会并不是从头做ChatGPT这类大模型，这既不现实，也不经济。

而真正的机会应该是，基于通用大语言模型，抢先开发重要的应用服务。

就好比移动互联网时代，最成功的商业产品不见得是安卓和IOS，而是基于安卓和IOS开发的微信、淘宝、抖音等应用。

李彦宏在现场预测到，大模型时代将产生三大产业机会。

第一类是新型云计算公司，主流商业模式从IaaS变为MaaS。

文心一言将根本性改变云计算行业的游戏规则。

以前，企业选择云厂商，更多看算力、存储等基础云服务。而在未来，更多会看框架好不好、模型好不好，以及模型、框架、芯片、应用之间的协同。

第二类是进行行业模型精调的公司，这是通用大模型和企业之间的中间层，他们具有行业Know how，调用通用大模型能力，为行业客户提供解决方案。

而文心大模型，已经在电力、金融、媒体等领域，发布了10多个行业大模型。

第三类是基于大模型底座进行应用开发的公司，即应用服务提供商。

今天，基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景，已经涌现出很多创业明星公司，很可能就是未来的新巨头。

更多的杀手级应用、现象级产品、里程碑事件，即将诞生。

最后，李彦宏强调说，文心一言并不是中美科技对抗的工具，而是一代代百度技术人员追逐科技改变世界的梦想的产物，是百度服务亿万用户、赋能千行百业的全新平台，是创新驱动发展的最佳证明。

One More Thing

最后，是大家最关心的问题：怎么用上文心一言？

对此百度表示，3月16日起，首批用户将可通过邀请测试码在官网体验产品，后续会陆续开放更多名额。

企业方面，则可以通过搜索「百度智能云」进入官网，申请加入文心一言云服务测试。

直播结束后，科技圈掀起了狂欢，各类点评纷纷出现。

而巨头财经点评道——

GDP4.0和文心一言，完全是两种不同的外向气质。

一个是典型的美式英雄主义，一出场就是王炸完全的颠覆式创新，魔法级的技能让全球瞠目结舌;

一个是典型的中式实用主义，没有英雄，没有浪漫，很务实的市场需求理解，把十多年的积累组合升级，一点都不酷，还显得有点生涩。

我们渴望前者，我们习惯后者。

大家催来了文心一言，虽然不完美，也是一小步。

抗万钧之压，顶千夫之笑，走出这一小步，已经值得侧目。

参考资料：

https://live.baidu.com/m/media/pclive/pchome/live.html?room_id=8117393980

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章