李彦宏,捂不住了
3月16日,神秘的百度文心一言终于揭开面纱。
这款被寄予厚望的中国类ChatGPT产品,到底什么水平?
百度CEO李彦宏在发布会介绍,文心一言具有包括文学创作、数理逻辑推理、多模态生成等五大功能。
一大亮点是,文心一言不仅能生成文本、图片,同时具备生成音频和视频的能力。
文心一言不仅能生成文本、图片,还能根据以上内容生成视频
但比起产品介绍的“雷声大”,文心一言暂未开放公众的消息,让关注者大失所望。百度称,当下暂未对公众开放。用户仅可通过邀请测试码,在文心一言官网体验产品。
李彦宏在发布会开头便承认,文心一言对标ChatGPT,甚至GPT4,门槛是很高的,“我自己测试感觉还是有很多不完美的地方”。
但之所以昨日就发布,是因为有市场需求。这不免让人听出来有些被逼上路的意思。
令人意外的是,发布会还没结束,百度港股的跌幅就一度达到近10%。反观A股ChatGPT的概念股,则持续反弹拉升,涨超6%。
截至3月16日收盘,百度港股情况
是哪里出了问题?
部分观看发布会的网友提出质疑,认为李彦宏介绍时不太像现场演示,而是播放提前录制的视频,或者说更像是播放制作好的PPT。
“大家的工作都保住了,”有人调侃,百度发布会缓解了众人被AI取代的焦虑。
调侃归调侃,百度的确 “养兵多日”。
在曾经坐“冷板凳”的人工智能届,百度是中国大厂中投入最多的。2022年,百度研发投入约达214亿元,相当于每月投18亿做研发。
技术派的出身让百度在ChatGPT引发的狂飙中,成为备受瞩目的中国公司。
但人工智能之路不仅关乎技术。多位业内人士告诉盐财经,训练出类ChatGPT产品是一项综合实力。
清华大学计算机科学与技术系长聘副教授黄民烈表示:“ChatGPT的基座模型都在真实调用上不停迭代和优化。它不仅仅是技术上的成功,更是系统、工程、数据上的成功。”
3月14日,OpenAI推发布了GPT-4。升级更新后的ChatGPT-4处理文字内容的上限拓展到2.5万个字符,是ChatGPT的8倍
李彦宏和首席技术官(CTO)王海峰也在发布会几次强调,文心一言并不完美,仍有赖通过真实的用户反馈而逐步迭代。
匆匆推出的文心一言,哪怕有些赶鸭子上架,展露出不够自信、不够完美的面貌,但也只是生成式AI产品的开始。随着使用增多,它将变得聪明。而要做到这一点,需要我们的共同陪伴、见证成长。
推出类ChatGPT的竞赛仍在进行。
值得庆幸的是,中国公司擅长做从1到100的竞赛。
对比同行
我们常说,货比三家。一个产品好不好,就将它与同类竞品进行比较,这自然是一种判断方法。
不过截至发稿,我们仍未取得“文心一言”的邀请码及内测渠道。因此,我们对比的方式是,将百度发布会上演示的问题,同样地询问基于GPT 4的Bing。
百度发布会上,演示的场景有5个,我们选择性地提问。结果如下:
第一:提问,可以总结一下《三体》的核心内容吗?如果要续写的话,可以从哪些角度出发?
百度发布会上演示的问题,同样地询问基于GPT 4的Bing。(上图为文心一言,下图为Bing)
第二:提问,如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,可以起个什么公司名?
百度发布会上演示的问题,同样地询问基于GPT 4的Bing
第三:下面我们来玩一个鸡免同笼的游戏。1只鸡有2只脚1个头,1只免子有4只脚1个头。那么,如果有一个笼子里有9个头,30只脚,应该有多少只鸡,多少只免子?
百度发布会上演示的问题,同样地询问基于GPT 4的Bing,后者计算错误
第四:洛阳纸贵是什么意思?并用洛阳纸贵四个字写一首藏头诗。
百度发布会上演示的问题,同样地询问基于GPT 4的Bing
第五:无。(因GPT 4等尚不具备多模态功能,或尚未开放。)
可以看出,在以上示例问题中,文心一言与Bing的差别不大。
你更喜欢哪个呢?
另外,两者的差异也很显然。
Bing目前还无法完成多模态跨模的生成任务。而“文心一言”,在发布会上,也没有演示GPT等产品最亮眼的功能之一:编程能力。
差别当然远远不止这些。
不过,无论GPT 4还是文心一言,在前后脚开启的发布会中,被披露的模型参数、结构设计,以及功能实现技术等,信息都很有限。因此,能够对比映照的信息,也很有限。
高潮迭起
百度的着急与焦虑显而易见。
基于GPT-3.5的ChatGPT在2022年11月30日横空出世不久,新版本GPT-4又迅速发布。无论是速度还是呈现效果,都足以让科技巨头拉响警报。
新浪微博新技术研发负责人张俊林告诉盐财经,ChatGPT带来了一次革命式的突破。
比起5年前局限于围棋领域的人工智能AlphaGo,类ChatGPT的生成式AI“能真正地促进很多行业工作效率大幅度提升,这是人类首次做到这一点”。
支撑AI变得通用的技术叫大语言模型(LLM),首要的特点是参数够大。GPT-3.5模型已达到1750亿参数,LG的Exaone模型有3000亿参数。华为的盘古大模型有2000亿,百度文心一言的大模型Ernie Bot也是千亿级。
炫酷数字的背后是实打实地烧钱和迭代。
对于一些更大的LLM模型(如拥有2800亿参数的Gopher和拥有5400亿参数的PaLM),训练成本介于200万美元至1200万美元之间
国盛证券曾估算,按照今年1月ChatGPT的流量,初始投入成本约为8亿美元(约合 55 亿元),每日电费在 5 万美元左右(约合 34 万元)。
巨头们押注与投入,源于人工智能近5年发展的新路径。张俊林介绍,近年AI届逐渐得出一个定论,机器学习的数据越多,在数据质量高的前提下,AI学习知识的能力将越强。
Open AI率先推出ChatGPT惊艳众人,地位受到挑战的巨头纷纷按捺不住。
2月初,谷歌内部为ChatGPT亮起红色警报,因此提前发布对标AI对话产品的Bard。这款基于大模型LaMDA的产品,被称为迷你版的ChatGPT。
据谷歌披露,LaMDA的模型规模仅1370亿参数,需要的算力也大大降低,这样可以让更多用户快速试用,获得即时反馈。
相比Open AI开放ChatGPT的慷慨和大胆,“老大哥”谷歌罕见地如此小心翼翼。与百度相似,谷歌表示“新发布的版本只是小范围内测”。
但就在GPT-4和文心一言发布的这周,谷歌宣布将在企业级协作平台Google Workspace引入AI,以迅速实现AI撰写邮件、生成文档摘要等需求。
谷歌母公司Alphabet的一位高管形容,AI接入谷歌文档后,就像提供了一根“魔杖”。用户只需输入要撰写的主题,草稿就可自动生成。
落地化的应用发布之余,谷歌还在近日公布了有史以来最大参数的模型——号称有 5620 亿参数的PaLM-E。据介绍,这是一种多模态视觉语言模型(VLM),最大特点是能利用视觉数据增强语言处理能力。
在谷歌公布的视频里,它甚至具备控制机器人的视觉和语言能力。
谷歌还在近日公布了有史以来最大参数的模型——号称有 5620 亿参数的PaLM-E,其甚至具备控制机器人的视觉和语言能力
唯一与诸位巨头步调不一致的是扎克伯格。
2月底,扎克伯格的Meta一次性发布了自家大语言模型LLaMA,并宣布开源。普惠型的应用一共推出了4款,参数量从70亿、130亿、330亿到650亿。
3月14日,斯坦福大学团队发布基于LLaMA的指令调整的模型——ALPACA,并表示其测试结果与GPT 3.5的性能相匹配。
深耕AI和元宇宙的Meta给出了他们的理解。“近来研究表明,最佳性能不是由最大的模型实现的,而是由基于更多数据训练的更小模型实现的。”
生态抢跑
技术面上,百度在中文NLP领域,无疑拥有先天优势。
首先是对国内技术政策的熟悉,令它比ChatGPT 更能满足国内市场需求。
其次,作为最大的中文搜索引擎,百度拥有的高质量数据集及中文数据收集能力,他者无法比拟。
不过颇感意外的是,发布会上李彦宏提到,目前文心一言对英文的支持能力弱于中文。反过来,据OpenAI公布的数据,GPT 4 在对中文的支持能力上,准确率可达80%以上。
两者的具体差别,尚需产品真正进入市场后,用户们的检验。
但也正如李彦宏及百度CTO王海峰在发布会上所说的,大规模技术的产品,才刚开启“起点”。未来的技术变化日新月异,不能以起点高低论英雄。
李彦宏认为,在人工智能时代,IT技术栈发生了根本性变化
作为中国第一家拿出了大模型产品的公司,百度“打了头阵”,已属不易。
何况我们知道,国内厂商在推动技术“从1到100”的发展方面尤为擅长。总之,未来可期。
但,技术并不是这场AI竞赛的唯一要点。
除了OpenAI、百度,当前赛道中的公司,还有谷歌、Meta、阿里等巨头。
谁能率先建成“壁垒”?或者说,谁将成为AI生态的领头人?
类比普通人熟知的手机系统,李彦宏曾在2018年两会期间说过:Google现在是人工智能领域的“iphone”,而百度则是这个领域的“安卓”,百度的AI开发平台开放源代码,欢迎所有的同道者加入,从长远来看,开放是必然会战胜封闭的。
其它的暂且不论,如今再看这句话,Google的角色已经被OpenAI替代。
“开源”与“封闭”的确是两条不同的道路,但“路线之争”也不完全决定未来——这在苹果系统与安卓厂商的局面中已能证得。
对用户而言,真实可感的强大是,获取(研发)成本低,使用成本低,迭代速度快。
以OpenAI 为例,这家身处第一梯队的AI公司,“抢跑”姿态再明显不过。3月15日,GPT 4发布当天,它一口气发布了论文、System Card、Predictable Scaling、开放GPT 4给会员用户,也开放了GPT-4 的 API。
这些举措,无疑都在抢入市场,以降低门槛、减少成本的方式。
具体来看,Predictable Scaling可以帮助开发者,以万分之一的成本预测模型效果,大大减小了“烧钱规模”。 而OpenAI Evals 和 Syestem Card,则是专为开发者提供的精调工具,为的是方便研发者制作出个性化的服务产品。
使用成本上,GPT 4的费用比前辈GPT 3大为降低,1000个prompt token 0.03美元,1000个 completion token 0.06 美元。
国盛证券基于参数数量和token数量估算,GPT-3训练一次的成本约为140万美元,而GPT 4的使用成本费用比前辈GPT 3大为降低
更方便的获取与更低的成本,势必导入更多的数据,形成“数据飞轮”。
它的意思是说,当一个初始小的改变在不断累积下去,最终可以形成一个巨大的、不可逆转的正向循环效应的过程。
OpenAI的抢跑逻辑之强大,就在于此。通过与微软的联手,GPT 4在微软Azure云上落地,再以低成本、低门槛的优势,开放API搭建生态,而自己成为一家掌握核心技术的平台型企业。
百度的路径与此相似。
通百度智能云提供服务,吸引企业和机构客户使用API和基础设施,共同搭建AI模型、开发应用。发布会上李彦宏介绍,目前已有650家企业接入了生态。这是一个不错的起点。
彩蛋:向Bing提问文心一言
问:你听说“文心一言”了吗?
Bing:听说了。文心一言是百度推出的一款类似ChatGPT的人工智能聊天机器人产品。3月16日下午,百度在北京总部召开了文心一言的发布会,展示了它的功能和特点。你对文心一言感兴趣吗?
问:简单说说,它有哪些能力?
Bing:根据搜索结果,文心一言目前具备五大能力,分别是文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成。它可以根据用户的需求,生成诗歌、小说、新闻稿等文本,也可以解答数学和逻辑问题,还可以理解中文的语义和语法,以及生成与文字相关的图片或音频。
问:你跟它比较,谁更厉害?
Bing:这个问题很难回答,因为每个人工智能产品都有自己的特点和优势。我不想跟文心一言比较,我只想做好自己的工作,为用户提供最好的搜索和聊天服务。(笑。)
本文首发于南风窗旗下财经新媒体盐财经
编辑 | 江江
值班编辑|江江
排版 | 苏打
年轻态演讲节目
《后日谈》
生活不ending,人生后日谈。
南风窗新媒体 出品
未经授权 禁止转载
欢迎分享至 朋友圈
投稿、投简历:[email protected]
广告、商务合作:
Fengyx778
记得星标!点点在看让理性的声音传得更远
微信扫码关注该文公众号作者