大模型落地,百度智能云的关键一步|甲子光年
大模型落地排位赛开启。
作者|武静静
编辑|栗子
大模型的角逐戏切换到了下一幕。
在基础大模型排位赛如火如荼进行的同时,随着各家产品逐步面向公众开放,围绕AI原生应用的赛跑拉开了帷幕。
纵观全球市场,基于生成式AI构建的AI原生应用已经应接不暇。数据显示,GitHub上AI开源项目截止8月底数量达到了91万,相较于去年全年的增幅达到264%。根据Replit的数据,23年二季度AI项目环比增速达80%,相较于去年同期同比增长了34倍。
多位投资人都向「甲子光年」谈道,目前只看AI应用层机会。根据CBInsights数据,截至2023年第二季度,生成式AI的投融资较去年全年的25亿美元,增长了4.6倍,其中生成式AI应用层融资金融占三成。可以预见,这个比例将在接下来持续扩大。
这个机会大厂显然不会错过。百度作为国内大厂中第一个做出对标ChatGPT产品的企业,也在将AI原生应用作为当下重点。在2023年百度世界大会上,李彦宏谈道:“没有构建于基础模型之上的丰富的AI原生应用,大模型就一文不值。”
百度集团执行副总裁、百度智能云事业群总裁沈抖称:“我们每个月都在支持上万家客户的应用开发,百度智能云看到了五大需求。”
1.一切围绕落地
硅谷创业导师的Elad Gil发博客称,生成式AI的机会会经历四个阶段:①GenAI原生企业 → ②早期AI初创企业、部分大企业 → ③目前正在成立的下一波初创企业 → ④大企业运用潮,如今正处于第二个阶段向第三阶段发展的过程中。
生成式AI公司 Writer 在今年4月进行的一项对美国公司的调查数据显示,近 60% 的公司在2023年已经购买或计划购买至少一种生成式AI工具。
中国的大模型发展速度虽然不及美国,但随着基础大模型的逐步开放,应用层的机会显然是接下来的重头戏。
沈抖称,在大模型落地时代,百度智能云看到五重需求端机会:
第一类,对高效的算力的需求,很多企业用户和开发者都希望降低大模型训练和推理的成本;
第二类,希望直接调用API,快速便捷的做开发和落地;
第三类,需要大模型二次开发的工具链,来进行针对性的再训练、微调、评估和部署;
第四类,对大模型开发服务的需求,希望更便捷的开发AI原生应用;
第五类,对AI应用的需求。
这些需求,来自于与百度智能云千帆大模型平台上超过17000家客户的交流和沟通。据透露,千帆大模型API的调用量还在持续高速攀升,更多企业和开发者在不断地加入。
大模型技术来到了真刀真枪跑落地的阶段。
在今年3月发布文心一言之时,李彦宏就宣称,看好这波浪潮中AI应用的机会。他说:“真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,而是基于通用大语言模型抢先开发重要的应用服务。未来,将会有更多的杀手级应用、现象级产品出现。”
半年后,在百度世界2023大会上,百度公布了在AI原生应用的全新布局:一头是一系列百度自研的AI原生应用,一头是围绕AI原生应用开发全新升级了“云智一体”战略,面向五类需求打造能提供全栈服务方案的“大模型超级工厂”。
应用侧,百度发布了文心大模型4.0,以及被文心大模型改造的百度搜索、如流“超级助理”、百度文库、百度网盘智能助理 “云一朵”产品,和AI原生打造的百度 GBI (生成式商业智能)。
服务方案侧,百度智能云“大模型超级工厂”针对性的提供了算力、API、工具链、能力组件、AI原生应用开发工作台五类服务方案。
算力层,千帆平台的万卡规模集群训练的加速比达到95%,万卡集群有效训练时间占比超过96%,大幅降低算力与时间成本,且还兼容昆仑芯、昇腾、海光DCU、英伟达、英特尔等国内外主流AI芯片,支持客户以最小的切换成本完成算力适配。沈抖透露,面壁智能的“知海图AI”大模型和多模态大模型Luca,就是基于百度智能云提供的AI算力集群打造,其在千卡集群上的有效训练时间占比高达99%。
模型层面,目前百度千帆平台纳管了42个国内外主流大模型,企业客户可以快速调取包括文心大模型在内的各种大模型的API,获取大模型能力。
对于希望基于现有大模型进行二次开发的客户,千帆平台可以提供大模型再训练、微调、评估和部署等环节的全生命周期工具链,以及业界最多的41个高质量行业数据集,帮助开发者和企业针对自身业务场景快速优化。百度称,中国邮政储蓄银行、度小满、金山办公、河北高速集团等诸多行业头部客户都在通过千帆平台提供的工具链服务进行专属大模型开发。
针对想基于大模型服务开发AI原生应用的需求,百度智能云推出了“千帆AI原生应用开发工作台”,提供了一系列能力组件与框架,让企业和开发者可以快速开发AI原生应用。
此外,百度智能云上线了类似安卓、IOS的国内首个AI原生应用商店,让用户可以直接使用成熟的AI原生应用产品的,这是百度智能云推出的首个大模型全链路生态支持体系中的重要内容。
2.AI原生应用浪潮中的平台机会
随着算法及模型的快速进步,技术的闸口打开之后,如何借助生成式AI技术打造这个时代的杀手锏应用是很多企业和创业者当下的课题。IDC报告预计,到2024年,人工智能市场将达到5543亿美元,增长的很大一部分将由生成式人AI初创公司推动,来自营销、设计、客户支持、金融科技、媒体制作和互动娱乐等应用层的机会巨大。
这波机会中,平台层的机会除了云计算等基础设施之外,更新的增量空间在于为AI 应用开发做支撑,提供可以支撑全生命周期的工具链和组件服务。
由于大模型是一项新的技术,基础模型公司百花齐放,在工程设计、接口方案等方面尚未形成一个标准化的共识,开发者也没有太多的经验可以借鉴。要开发一个AI原生应用产品会面临复杂的工具选择过程。市场需要围绕开发而生的一体化平台和成熟的工具链服务。
国内外的科技大厂是担任这个角色的关键力量,他们作为有钱、有人、有经验的一方,有更大的资本为开发者构建产品运营的“高速公路”。
百度正在优先布局这层机会。此次,在百度世界大会上,百度智能云推出的“千帆AI原生应用开发工作台”,这是一个沉淀了百度开发大模型应用的常见模式、工具、流程的平台。
千帆AI原生应用开发工作台主要由应用组件、应用框架两层服务构成。
应用组件服务是将底层服务能力进行了组件化封装,由AI和基础云两大类组件构成。其中,“AI组件”中既包含诸如问答、思维链(CoT,ChAIn of Thought)等大语言模型组件,还包括文生图、语音识别等多模态组件;另一类是基础云组件,包含向量数据库、对象存储等。
应用框架则是将这些组件有选择地串联、组合的一整套经验,可以让开发者快速搭建一个特定场景的任务。目前,千帆平台中的检索增强生成(RAG)、智能体(Agent)、生成式商业智能(GBI)就是典型的AI原生应用框架。此外,每个框架下,百度智能云还提供了丰富的样板间,支撑开发者敏捷、高效地进行AI原生应用开发。
“这些组件能力都是百度在过去10年逐步沉淀下来的。”沈抖说。
现场,百度实时演示了用检索增强生成(RAG)能力,结合三一重工提供的一款挖掘机操作保养手册,用几分钟时间,就在三一重工官网上快速搭建一个7×24小时在线服务的智能客服。
“RAG的原理是,把一个大文件切成一片一片的小文件,用向量引擎来索引这些片段,构建出一个向量数据库。当客户进行提问,系统就可以在片段里找出相关内容,让大模型根据内容提炼,最后生成回复。”沈抖谈道。
另一个AI原生应用框架Agent(智能体)则能自动拆解任务,做规划,并调⽤各种组件完成任务,且能根据完成的效果去反思改进自己的能力。百度称,Agent已经在工业、交通等领域落地。
其中一个案例就是制造业头部企业“中天钢铁”,通过Agent应用框架,实现了在钢产量不足的情况下,调动各种各样的应用,生成一个解决方案,调整排产计划,最后把整个方案用邮件的方式再发给调度员的任务闭环。过程中的原理就是进行任务指令感知、基于工具集的任务分解、以及多任务的自动执行应用。
从这些实践可以看出,“千帆AI原生应用开发工作台”就是百度依靠自身在大模型的模型训练、数据整合、应用开发、应用部署的全流程实践总结的一整套方法论。
“我们想让每一个开发者聚焦在自己的业务诉求上,不再为研发过程发愁。”沈抖说。
3.生态的“大谋”:造大模型时代的大船
工具链和平台只是百度在AI 大模型时代,MaaS服务中的一环。这些基础之上,百度更大的谋划在造生态上。
目前,百度智能云大模型生态伙伴计划包括10+综合伙伴、100+应用伙伴、1万+创业企业,以及代理伙伴。
大模型时代,MaaS模式中,生态的战略和打法也要经历新的变化。
这与新技术带来的环境变化有关,随着大模型技术的持续推进,云计算赛道的本质正在发生转变——过去十年,云计算服务的本质是资源,所有的生态伙伴和服务方都在围绕资源云运作;大模型时代,云计算从资源服务转变成只能服务,需要内嵌到应用中,通过应用呈现能力。
整个云计算赛道的供给规则也在随之发生变化,云厂商和生态伙伴的关系也在迎来新的转变。百度智能云产业发展部总经理段永华告诉「甲子光年」:“以前,云厂商只是单纯的售卖资源,如今,资源之外,云厂商还要和应用伙伴一块,打造端到端的智能化应用,真正支撑业务价值。”
“应用在这个时代会变得更重要,应用厂商会成为聚光灯下的最重要的角色。”段永华说。
所以,升级后百度智能云生态体系的重点会围绕AI原生应用来打造。他们希望和生态伙伴一起打造应用的样板间,探索大模型落地的路径。
在世界大会上,百度智能云也基于伙伴发展计划,率先推出了国内第一个大模型全链路生态支持体系:围绕伙伴和创企,提供包括培训赋能支持、AI原生应用创新孵化支持、销售商机支持、市场营销支持,以及千帆社区、千帆AI原生应用商店的服务。
“千帆AI原生应用商店”就是其中一个重要的生态动作。
我们可以将“千帆AI原生应用商店”理解成一个AI原生应用的App Store,旨在更好的连接AI原生应用的供给方和需求方。
“千帆AI原生应用商店”不仅会做应⽤的展示,还支持便捷⾼效的应⽤交易。”段永华提到,“我们希望它不仅可以提高我们企业客户选型和采购方面的效率,也希望帮助这些商家能够快速的把他们开发的应用推向市场。”
目前,商店中首批精选应用已经正式上线,金蝶就是首批入驻应用商店的伙伴之一,公司基于千帆打造了国内首个财务管理领域的大模型,正在推进大模型与全业务场景的融合落地。
商店之外,百度搭建的千帆社区专门为大模型而生,汇聚一线实践经验,并提供了丰富的产品工具。此外,百度智能云打造了业内第一个大模型实训营——千帆AGI House,以及各种创新孵化支持,其中,千帆AGI House已经覆盖了北京、上海、深圳等地区的上百家伙伴。百度也在持续落地千帆AI加速器的项目,为伙伴做技术赋能、技术资源投入、牵引投资和营销资源支持。百度称,通过千帆AI加速器,已经开发出超过22个商业化应用,加速器的成员中,70%以上为创始人、董事长、CXO。
百度智能云生态合作伙伴庖丁科技,此前只聚焦金融行业。许多银行、券商、交易所等金融机构都在利用其应用AutoDoc审核文档,确保信息披露文件的准确性。现在,基于千帆平台,庖丁科技开发了智能文档应用“庖丁解文 ChatDOC”,极大降低了跨行业的成本,具备跨行业的能力,正在向新能源、医药等领域推进落地。
这是百度在大模型时代造生态的一整套新方法论。
通往AGI的未来之路上,百度希望造新的大船。
“大模型时代来了,风起云涌,有人争着弄潮,有人忙着逐浪,而我们致力于造一艘坚实的大船。”沈抖说。
END.
点击文末“阅读原文”
进入「甲子光年」官网
了解更多精彩内容
微信扫码关注该文公众号作者