李彦宏再快一步
速度
首钢园很热,往冰球馆的路被车堵住,排成一条长龙。很远就能看到工作人员连绵地举着牌子:百度世界 2023。
尽管还有 10 分钟就要开场,签到台的人群依旧摩肩接踵,每个工作人员都像长了八只手,帮助大家尽快拿到证件顺利入场。
进入主会场前的 L 型通道被布置成了长长的展区,百度的所有产品都在此亮相,而大模型是绕不过去的主题,事实上走过炫目的 AIGC 生成图片画廊后,打头阵的就是飞桨和文心大模型,展板上密密麻麻罗列着它发展的时间轨迹,最早可以追溯到 2012 年。随着年份的逐渐临近,更新和迭代的速度也越来越快。
事实上,速度是百度给人留下的一个鲜明印象,ChatGPT 引爆的这一波以大模型为主的人工智能浪潮中,百度一直是速度最快的那个,3 月文心一言按照李彦宏的承诺如约发布,8 月底它又成为了首批通过审核向全社会开放的生成式 AI 应用。李彦宏谈到百度突飞猛进的进展时曾不讳言地用“卷”来形容这种速度,而他的原话是针对大模型领域创业者说的:卷基础模型没意义,而卷应用机会更大。
这背后是百度基础模型能力迅猛的能力提升。
10 点整,李彦宏的演讲没有一分钟延迟,准时开始,场内鳞次栉比坐满了人,稍微迟到的甚至临时坐在了过道连接处,要么索性直接就站在出口旁。每个人都想要更直接的第一时间看到大模型又“卷”出了怎样的新高度,某种意义上,李彦宏治下的百度代表了中国人工智能和大模型领域最新和最尖端的技术进展。
而百度给出的答案是文心大模型 4.0。相比于目前的 3.5 版本,文心大模型 4.0 的进步幅度,用李彦宏的话说,“综合水平与 GPT-4 相比已经毫不逊色。”
为了论证这一点,李彦宏在现场花了20 多分钟时间依次测试了基础模型的几大能力——百度把它们分类成四种,理解、生成、逻辑和记忆。按照随后百度 CTO 王海峰现场的说法,这几种能力的提升幅度甚至不是平均的,逻辑能力的提升幅度是理解的 3 倍,记忆能力的提升幅度是理解的2倍。
而另一个更让人印象深刻的数据是,9 月就已小规模测试的文心大模型 4.0 在过去一个月之内,能力就又提升了 30%。训练算法效率自3月以来已累计提升了3.6倍,而周训练有效率则来到了98%。
百度有关大模型的一切都在突飞猛进。
原生
李彦宏那句“卷应用”的论断,另一层想表达的意思是,一切应用都值得基于大模型能力重做一遍。或者也可以这样说,没有构建于基础模型之上的丰富 AI 原生应用,大模型就一文不值。
当然这话与其说是李彦宏讲给别人听的,不如说是对百度的要求。在 5 月李彦宏就已经公开放话,百度要做第一个把现有产品都进行重构、重做的公司。
现在检验的时刻到了。在百度世界 2023大会上,李彦宏的背后,首钢园冰球馆超宽的荧幕上一次性排列了 20 个百度产品的 logo,它们正是李彦宏所说的百度 AI 原生应用。
首当其冲的当然是老本行搜索。生成式 AI 和搜索堪称天作之合,基础模型的能力不仅提升搜索质量,而且突破了搜索的应用范畴,用李彦宏的话说,“产品的边界扩大了。”
百度搜索的 UI 尽管还是那个简单的框,但整个搜索的运作模式都已全然不同。它已经可以基于自然语言的多轮交互给出最优答案,甚至可以触类旁通地推荐涉及相关知识点的关联问题。
李彦宏现场的演示中给出的例子是用百度搜索“过去 20 年各国工业增加值的排名”这个问题,而返回的除了精准的答案,甚至还包括了一个以年为时间轴实时变动的动态图表,以及与之相关联的一系列问题。
搜索的形态实际上已经走向完全颠覆,有关搜索的数据鲜明地指向了这一点,百度搜索中有 60%的提问寻求的是精准答案;用户最多同搜索进行了275 轮对话互动;一个月之内用户生成绘画的需求增长了十倍。
通用理解、跨模态与逻辑能力,这些大模型出现之前难以想象的能力现在已经在新的百度搜索中走向普惠,而早就宣称要刀刃向内,革自己命的百度甚至在下午的 AI 原生应用前沿论坛上发布了一个全新的 APP——简单搜索,百度搜索平台负责人肖阳宣称这是首个 AI 互动式搜索引擎。
因为大模型,一个在中国搜索领域执牛耳者推出了一个崭新的搜索。
事实上,这不是百度世界 2023 上唯一一款全新的 AI 原生应用,李彦宏在演讲中还介绍了一个名为百度 GBI的新应用。GBI 里的 G 是 generative 的意思,顾名思义它是一个拥有生成式 AI 能力的 BI 工具,可以对多数据源进行交叉分析,从而回答有关财务分析、项目进度、用户运维等多种复杂商业问题。
这一个完全基于 AI 能力的全新产品,用另一种说法形容就是,在生成式 AI 之前,相关BI能力几乎不可能实现。
重构
文心大模型能力的提升,是一切AI原生应用赖以生存的基础。
办公软件如流可以一键生成会议要点,让开会时长缩短 40%,可以像一个真人助理一样理解复杂办公场景,甚至可以根据日程表安排差旅行程。
百度网盘的“云一朵”可以通过自然语言帮助你在庞大的网盘资料中找到对应的图片甚至视频,哪怕是其中的片段内容都可以。
地图产品则被李彦宏冠以“全球首个 AI 原生地图产品”的称号,百度地图 18 年来积累的数千个地图相关 API 接口都已经接入大模型中,所有的功能都可以运用自然语言通过对话调用,换而言之你从此就告别层层叠叠的多级功能页面了。
从这个角度上讲,尽管APP的 logo 还是人们熟悉的样子,但它们的用法和代表的能力已经全然不同。
李彦宏着重以百度文库举了例子。大模型的到来让百度文档直接从内容工具升级到了生产力工具:高达十亿规模的庞大文档资源被大模型活化,它可以帮助你找寻任何资料、生成结构完整的文章同时还能润色和排版,甚至能够基于生成的内容与资料做出一个几十页的 PPT。
这背后不仅需要大模型跨模态的生成能力,还需要对内容有精准的理解,不是泛泛而谈,也不是一本正经的胡说八道,而是真正构建有深度的精确内容。
这款重构最彻底的产品,现在被李彦宏称为内容生产最好的起点。
这家成立已经二十多年的公司,在创始人的主导下,一切都在飞快改变。
判断
现在,百度有了两样快人一步的“武器”:文心大模型 4.0 完备的模型能力以及完整的AI原生应用矩阵。它们的结合带来了一些奇妙的化学反应。
比如最早在 5 月万象大会上亮相的文心一言 APP,这里我们不去谈它迅疾的迭代速度以及正式上线以来取得的亮眼数据,仅仅就它本身作为一款对话式AI 的特点来看,文心一言 APP就具备了极大的想象空间。
百度正在全面展示它的潜力。在上线了原神角色等颇受好评的机器人后,在这次世界大会上百度进一步在文心一言 APP 中引入了洛天依这一知名的虚拟偶像——它在文心一言用户评选的最想要对话角色中排名第一。
另一个文心一言APP 合作的对象是奈雪的茶,百度表示你很快就可以动动嘴点奶茶了,事实上尽管发布会上百度表示在下单功能上线之前已率先安排了各种优惠券的发放,但其实早在发布会之前,这些优惠券已经被领完了。
“没有想到,发布会还没来得及开,优惠券就被领完了。”现场的一位工作人员表示。出乎预料的火爆恐怕也从侧面反映出了对话式人工智能在未来的商业化潜力——成为一个无所不能的超级入口,用户最终会为模型出色的应用能力而留在这里。
这恰好回到了李彦宏的判断。在不少人热衷于基础模型能力,甚或投入于垂直模型的潮流中时,百度一直按照李彦宏的设想,齐头并进地在提升基础模型能力和重构 AI 原生应用这两条路上有条不紊地走着。
实力
实际上纵观百度在这一波人工智能爆发中的动作,可以品出它自己独特的思路——应用在某种意义上更重要,这也正是百度相比竞争对手动作更快的原因。
这当然不是说模型的能力不重要,然而经过一年以来生成式 AI 浪潮的吹打,越来越多人意识到的一个问题是,规模化优势,也就是所谓的大力出奇迹,恐怕同样适用于应用领域。
甚至,更具体一点说来,基础模型的能力恐怕并不是简单靠堆卡就能达成,这背后涉及到非常复杂的工程化能力与技术经验积累,换而言之同样的卡、性能乃至算法,在不同的人手中会炼出截然不同性能的大模型。
百度先手的第一步体现在这里。外界熟悉的百度人工智能四层架构不是一个天上掉下来的,或者为了赶热度临时拼凑出来的噱头,相反它来自百度十多年来的长期持续投入,这背后自然有李彦宏的独到眼光加持,人工智能在很长一段时间里都不是什么“热门赛道”,在这波生成式AI浪潮涌起之前,商业化前景更很难称得上明朗,如果没有创始人的坚持,恐怕这条赛道早已被放弃。
而在应用侧,目前在牌桌上的大模型玩家中,百度恐怕是着墨最多的。一方面本来百度就拥有一个相当成熟的产品矩阵,其中不乏大量的高质数据(百度百科、百度文库),另一方面,李彦宏恐怕是少数从一开始就意识到应用价值的人——规模化效应最终将弥补开发、运营模型的庞大开支,但前提是你的应用要能够抢先占领用户心智,而开发一款或者一系列足够好的AI原生应用,不仅考验着对大模型的理解程度,还意味着要把过去的一切推倒重来,这需要整个组织自上而下极强的信念来推动,也考验着百度规模化产品化的能力。
现在,百度的阶段性答卷已经摆在所有人面前。
众里寻他千百度,辛弃疾的《青玉案·元夕》是百度名字的来历,这首词本来的意思是穷尽各种手段搜寻自己心爱的人,而对叩开人工智能浪潮的百度来说,李彦宏清晰敏锐判断带来的领先已毋庸置疑,下一步在灯火阑珊处的妙人究竟是何模样,值得所有人一同期待。
微信扫码关注该文公众号作者