李彦宏，捂不住了

公众号新闻

2023-03-17 03:03

作者 | 朱之林

3月16日，神秘的百度文心一言终于揭开面纱。

这款被寄予厚望的中国类ChatGPT产品，到底什么水平？

百度CEO李彦宏在发布会介绍，文心一言具有包括文学创作、数理逻辑推理、多模态生成等五大功能。

一大亮点是，文心一言不仅能生成文本、图片，同时具备生成音频和视频的能力。

文心一言不仅能生成文本、图片，还能根据以上内容生成视频

但比起产品介绍的“雷声大”，文心一言暂未开放公众的消息，让关注者大失所望。百度称，当下暂未对公众开放。用户仅可通过邀请测试码，在文心一言官网体验产品。

李彦宏在发布会开头便承认，文心一言对标ChatGPT，甚至GPT4，门槛是很高的，“我自己测试感觉还是有很多不完美的地方”。

但之所以昨日就发布，是因为有市场需求。这不免让人听出来有些被逼上路的意思。

令人意外的是，发布会还没结束，百度港股的跌幅就一度达到近10%。反观A股ChatGPT的概念股，则持续反弹拉升，涨超6%。

截至3月16日收盘，百度港股情况

是哪里出了问题？

部分观看发布会的网友提出质疑，认为李彦宏介绍时不太像现场演示，而是播放提前录制的视频，或者说更像是播放制作好的PPT。

“大家的工作都保住了，”有人调侃，百度发布会缓解了众人被AI取代的焦虑。

调侃归调侃，百度的确 “养兵多日”。

在曾经坐“冷板凳”的人工智能届，百度是中国大厂中投入最多的。2022年，百度研发投入约达214亿元，相当于每月投18亿做研发。

技术派的出身让百度在ChatGPT引发的狂飙中，成为备受瞩目的中国公司。

但人工智能之路不仅关乎技术。多位业内人士告诉盐财经，训练出类ChatGPT产品是一项综合实力。

清华大学计算机科学与技术系长聘副教授黄民烈表示：“ChatGPT的基座模型都在真实调用上不停迭代和优化。它不仅仅是技术上的成功，更是系统、工程、数据上的成功。”

3月14日，OpenAI推发布了GPT-4。升级更新后的ChatGPT-4处理文字内容的上限拓展到2.5万个字符，是ChatGPT的8倍

李彦宏和首席技术官(CTO)王海峰也在发布会几次强调，文心一言并不完美，仍有赖通过真实的用户反馈而逐步迭代。

匆匆推出的文心一言，哪怕有些赶鸭子上架，展露出不够自信、不够完美的面貌，但也只是生成式AI产品的开始。随着使用增多，它将变得聪明。而要做到这一点，需要我们的共同陪伴、见证成长。

推出类ChatGPT的竞赛仍在进行。

值得庆幸的是，中国公司擅长做从1到100的竞赛。

对比同行

我们常说，货比三家。一个产品好不好，就将它与同类竞品进行比较，这自然是一种判断方法。

不过截至发稿，我们仍未取得“文心一言”的邀请码及内测渠道。因此，我们对比的方式是，将百度发布会上演示的问题，同样地询问基于GPT 4的Bing。

百度发布会上，演示的场景有5个，我们选择性地提问。结果如下：

第一：提问，可以总结一下《三体》的核心内容吗？如果要续写的话，可以从哪些角度出发？

百度发布会上演示的问题，同样地询问基于GPT 4的Bing。（上图为文心一言，下图为Bing）

第二：提问，如果要成立一个用大模型服务中小企业数字化升级的科技服务公司，可以起个什么公司名？

百度发布会上演示的问题，同样地询问基于GPT 4的Bing

第三：下面我们来玩一个鸡免同笼的游戏。1只鸡有2只脚1个头，1只免子有4只脚1个头。那么，如果有一个笼子里有9个头，30只脚，应该有多少只鸡，多少只免子？

百度发布会上演示的问题，同样地询问基于GPT 4的Bing，后者计算错误

第四：洛阳纸贵是什么意思？并用洛阳纸贵四个字写一首藏头诗。

百度发布会上演示的问题，同样地询问基于GPT 4的Bing

第五：无。（因GPT 4等尚不具备多模态功能，或尚未开放。）

可以看出，在以上示例问题中，文心一言与Bing的差别不大。

你更喜欢哪个呢？

另外，两者的差异也很显然。

Bing目前还无法完成多模态跨模的生成任务。而“文心一言”，在发布会上，也没有演示GPT等产品最亮眼的功能之一：编程能力。

差别当然远远不止这些。

不过，无论GPT 4还是文心一言，在前后脚开启的发布会中，被披露的模型参数、结构设计，以及功能实现技术等，信息都很有限。因此，能够对比映照的信息，也很有限。

高潮迭起

百度的着急与焦虑显而易见。

基于GPT-3.5的ChatGPT在2022年11月30日横空出世不久，新版本GPT-4又迅速发布。无论是速度还是呈现效果，都足以让科技巨头拉响警报。

新浪微博新技术研发负责人张俊林告诉盐财经，ChatGPT带来了一次革命式的突破。

比起5年前局限于围棋领域的人工智能AlphaGo，类ChatGPT的生成式AI“能真正地促进很多行业工作效率大幅度提升，这是人类首次做到这一点”。

支撑AI变得通用的技术叫大语言模型（LLM），首要的特点是参数够大。GPT-3.5模型已达到1750亿参数，LG的Exaone模型有3000亿参数。华为的盘古大模型有2000亿，百度文心一言的大模型Ernie Bot也是千亿级。

炫酷数字的背后是实打实地烧钱和迭代。

对于一些更大的LLM模型（如拥有2800亿参数的Gopher和拥有5400亿参数的PaLM），训练成本介于200万美元至1200万美元之间

国盛证券曾估算，按照今年1月ChatGPT的流量，初始投入成本约为8亿美元（约合 55 亿元），每日电费在 5 万美元左右（约合 34 万元）。

巨头们押注与投入，源于人工智能近5年发展的新路径。张俊林介绍，近年AI届逐渐得出一个定论，机器学习的数据越多，在数据质量高的前提下，AI学习知识的能力将越强。

Open AI率先推出ChatGPT惊艳众人，地位受到挑战的巨头纷纷按捺不住。

2月初，谷歌内部为ChatGPT亮起红色警报，因此提前发布对标AI对话产品的Bard。这款基于大模型LaMDA的产品，被称为迷你版的ChatGPT。

据谷歌披露，LaMDA的模型规模仅1370亿参数，需要的算力也大大降低，这样可以让更多用户快速试用，获得即时反馈。

相比Open AI开放ChatGPT的慷慨和大胆，“老大哥”谷歌罕见地如此小心翼翼。与百度相似，谷歌表示“新发布的版本只是小范围内测”。

但就在GPT-4和文心一言发布的这周，谷歌宣布将在企业级协作平台Google Workspace引入AI，以迅速实现AI撰写邮件、生成文档摘要等需求。

谷歌母公司Alphabet的一位高管形容，AI接入谷歌文档后，就像提供了一根“魔杖”。用户只需输入要撰写的主题，草稿就可自动生成。

落地化的应用发布之余，谷歌还在近日公布了有史以来最大参数的模型——号称有 5620 亿参数的PaLM-E。据介绍，这是一种多模态视觉语言模型（VLM），最大特点是能利用视觉数据增强语言处理能力。

在谷歌公布的视频里，它甚至具备控制机器人的视觉和语言能力。

谷歌还在近日公布了有史以来最大参数的模型——号称有 5620 亿参数的PaLM-E，其甚至具备控制机器人的视觉和语言能力

唯一与诸位巨头步调不一致的是扎克伯格。

2月底，扎克伯格的Meta一次性发布了自家大语言模型LLaMA，并宣布开源。普惠型的应用一共推出了4款，参数量从70亿、130亿、330亿到650亿。

3月14日，斯坦福大学团队发布基于LLaMA的指令调整的模型——ALPACA，并表示其测试结果与GPT 3.5的性能相匹配。

深耕AI和元宇宙的Meta给出了他们的理解。“近来研究表明，最佳性能不是由最大的模型实现的，而是由基于更多数据训练的更小模型实现的。”

生态抢跑

技术面上，百度在中文NLP领域，无疑拥有先天优势。

首先是对国内技术政策的熟悉，令它比ChatGPT 更能满足国内市场需求。

其次，作为最大的中文搜索引擎，百度拥有的高质量数据集及中文数据收集能力，他者无法比拟。

不过颇感意外的是，发布会上李彦宏提到，目前文心一言对英文的支持能力弱于中文。反过来，据OpenAI公布的数据，GPT 4 在对中文的支持能力上，准确率可达80%以上。

两者的具体差别，尚需产品真正进入市场后，用户们的检验。

但也正如李彦宏及百度CTO王海峰在发布会上所说的，大规模技术的产品，才刚开启“起点”。未来的技术变化日新月异，不能以起点高低论英雄。

李彦宏认为，在人工智能时代，IT技术栈发生了根本性变化

作为中国第一家拿出了大模型产品的公司，百度“打了头阵”，已属不易。

何况我们知道，国内厂商在推动技术“从1到100”的发展方面尤为擅长。总之，未来可期。

但，技术并不是这场AI竞赛的唯一要点。

除了OpenAI、百度，当前赛道中的公司，还有谷歌、Meta、阿里等巨头。

谁能率先建成“壁垒”？或者说，谁将成为AI生态的领头人？

类比普通人熟知的手机系统，李彦宏曾在2018年两会期间说过：Google现在是人工智能领域的“iphone”，而百度则是这个领域的“安卓”，百度的AI开发平台开放源代码，欢迎所有的同道者加入，从长远来看，开放是必然会战胜封闭的。

其它的暂且不论，如今再看这句话，Google的角色已经被OpenAI替代。

“开源”与“封闭”的确是两条不同的道路，但“路线之争”也不完全决定未来——这在苹果系统与安卓厂商的局面中已能证得。

对用户而言，真实可感的强大是，获取（研发）成本低，使用成本低，迭代速度快。

以OpenAI 为例，这家身处第一梯队的AI公司，“抢跑”姿态再明显不过。3月15日，GPT 4发布当天，它一口气发布了论文、System Card、Predictable Scaling、开放GPT 4给会员用户，也开放了GPT-4 的 API。

这些举措，无疑都在抢入市场，以降低门槛、减少成本的方式。

具体来看，Predictable Scaling可以帮助开发者，以万分之一的成本预测模型效果，大大减小了“烧钱规模”。而OpenAI Evals 和 Syestem Card，则是专为开发者提供的精调工具，为的是方便研发者制作出个性化的服务产品。

使用成本上，GPT 4的费用比前辈GPT 3大为降低，1000个prompt token 0.03美元，1000个 completion token 0.06 美元。

国盛证券基于参数数量和token数量估算，GPT-3训练一次的成本约为140万美元，而GPT 4的使用成本费用比前辈GPT 3大为降低

更方便的获取与更低的成本，势必导入更多的数据，形成“数据飞轮”。

它的意思是说，当一个初始小的改变在不断累积下去，最终可以形成一个巨大的、不可逆转的正向循环效应的过程。

OpenAI的抢跑逻辑之强大，就在于此。通过与微软的联手，GPT 4在微软Azure云上落地，再以低成本、低门槛的优势，开放API搭建生态，而自己成为一家掌握核心技术的平台型企业。

百度的路径与此相似。

通百度智能云提供服务，吸引企业和机构客户使用API和基础设施，共同搭建AI模型、开发应用。发布会上李彦宏介绍，目前已有650家企业接入了生态。这是一个不错的起点。

彩蛋：向Bing提问文心一言

问：你听说“文心一言”了吗？

Bing：听说了。文心一言是百度推出的一款类似ChatGPT的人工智能聊天机器人产品。3月16日下午，百度在北京总部召开了文心一言的发布会，展示了它的功能和特点。你对文心一言感兴趣吗？

问：简单说说，它有哪些能力？

Bing：根据搜索结果，文心一言目前具备五大能力，分别是文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成。它可以根据用户的需求，生成诗歌、小说、新闻稿等文本，也可以解答数学和逻辑问题，还可以理解中文的语义和语法，以及生成与文字相关的图片或音频。

问：你跟它比较，谁更厉害？

Bing：这个问题很难回答，因为每个人工智能产品都有自己的特点和优势。我不想跟文心一言比较，我只想做好自己的工作，为用户提供最好的搜索和聊天服务。（笑。）

本文首发于南风窗旗下财经新媒体盐财经‍‍‍‍‍‍‍‍

编辑 | 江江‍‍

值班编辑｜江江

排版 | 苏打

年轻态演讲节目

《后日谈》

生活不ending，人生后日谈。

点击图片即刻订阅

天猫、京东南风窗旗舰店已上线

南风窗新媒体出品

未经授权禁止转载

欢迎分享至朋友圈

投稿、投简历：[email protected]

广告、商务合作：

Fengyx778

记得星标！点点在看让理性的声音传得更远

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章