百度智能云要用更强、更高效的千帆大模型平台,打赢「大模型落地」这场战争。
5 月 28 日,中信所、科技部新一代人工智能发展研究中心等机构联合发布的《中国人工智能大模型地图研究报告》显示,中国 10 亿参数规模以上的大模型数量为 79 个。上个月,赛迪顾问发布的《IT 2023》研究显示,截止 2023 年 7 月,我国现有大模型已经达到 130 个。数量不断增加,一方面反映国内厂商看好并对大模型引领的 AI 技术发展浪潮的未来前景充满信心,投入大量资金人力「押宝」它们;另一方面厂商正在面临加速应用落地的迫切命题,无论是通用大模型,还是垂类行业大模型,当务之急是找到客户和契合的场景。厂商的另一面是客户(包括企业、开发者),他们用或不用很大程度影响了大模型的命运。不过,从大模型的调用到场景应用,并非一蹴而就,要处理的问题还有很多,比如行业数据融合、后续调优、推理算力消耗、安全评估。解决了用的问题,更要关注用的顺手、用的长久。这些都需要大模型厂商下更多的功夫,从开发到部署应用整个链路,从大模型本身到平台,要尽可能地「想客户之所想、急客户之所需」。在这方面,百度智能云利用大模型平台满足客户多样化应用需求。9 月 5 日,2023 百度云智大会带来了新一轮技术改进和应用落地,包括更完善的大模型产品、工具和服务,以及基于大模型能力重构的四大行业解决方案。会上,我们看到了全新升级的百度智能云千帆大模型平台 2.0,包含支持大模型和数据集数量最多、工具链最完善、算力效能最佳和企业级安全四大亮点。基于千帆平台重构数字政府、金融、工业和交通等四大行业解决方案,在支撑千行百业落地上收获更多成功案例。AI 原生应用 Family,将不同行业客户共通的应用场景和业务需求在一个应用中搞定。首次公布月活企业数已近万家,覆盖政务、交通等 400 多个业务场景,并推出最新的生态伙伴计划。也就是说,百度更好地提升基础大模型实力的同时,也在迅速泛化自家的大模型能力给到各行各业、更多企业。我们观察到,随着大模型的不断发展,一些主流大模型厂商开始采用模型即服务(MaaS)这一创新模式,并希望基于这一理念构建更大的大模型平台或社区,让客户既可以自由调用各类第三方模型服务,又能够基于自有数据、特色开发、部署和调用专属服务。不过,满足客户需求并不是简单提供大模型就行了,配套的部署工具和算力等更底层的支撑同样重要,很大程度上决定了他们是否用得起、用得顺、用得高效。百度智能云在今年 3 月便有了动作,推出全球首个一站式企业级大模型平台 —— 千帆大模型平台。自那时起便开始致力于降低部署大模型门槛,加速通用或细分场景需求的落地。此后持续升级,全面接入 Llama 2 等 33 个第三方模型,预置 Prompt 模板,让需求迅速被理解。目的只有两个,一是让平台更易用、更高效,二是让客户更方便、更轻松。此次,全新升级的百度智能云千帆大模型平台 2.0(以下称千帆 2.0) 用更强、更全的功能和特性,拓宽和加深了平台能力。下面为千帆 2.0 全景图,我们从顶层、中间层到底层依次来解读。在顶层,千帆 2.0 支持的主流大模型增加到 42 个,数量国内最多,满足客户更多样业务场景需求。谈到为何持续增加大模型数量,沈抖表示,「大家可以根据自己业务的需要和场景来选择一个或多个大模型,满足不同业务场景的需求。」仅仅增加数量还不够,千帆 2.0 针对 Llama2、Falcon 等国外主流大模型做了中文增强,中文理解和生成能力显著提升,实现与英文语境下同样好的对话效果。开源模型也得到「特别关照」,知识增强、长期记忆增强、文档知识问答等各类长上下文理解能力更有力地释放。此外大模型在训练与推理层面也得到增强,以 Llama2 为例,总体吞吐可以提升 25%,推理速度提升 2 倍。这意味着聊天中更即时的响应速度、更快速的 AI 任务完成,用户感知体验大大提升。众所周知,数据是炼大模型成功的关键。接入大模型后很多时候还要做数据微调,这时如果有拿来即用的数据集就方便多了。千帆 2.0 考虑到了这一点,它预置了 41 个高质量、具有行业特色的数据集,通用、专用和指令皆有,为缺少相关数据的客户省去了数据处理成本,使用时只需要点几个按钮就能顺利完成微调。此外还提供了客服对话、文案续写等 10 个精选应用范式,用标准化的服务提升应用开发效率。与大模型配套的工具链是将它们与应用场景「贯通」的重要桥梁,对大模型使用效率的高低、客户开发环境的好坏极为关键。千帆 2.0 在中间层围绕大模型开发、训练、部署、应用开发全生命周期,提供了最丰富、最全面的工具链。一站式设计保证了大模型飞速运转,通过无缝衔接全生命周期各个业务流程,让企业摆脱重复造轮子的困境,工程效率自然而然得到提升。效果也是立竿见影,以往耗时一周才能调试、 跑通看到的效果,千帆 2.0 工具链则实现了当天见效果,效率提升的同时周期大大缩短。对于客户而言,省时省力又省钱。来到千帆 2.0 的底层 ——AI 算力基础设施。大模型对算力的需求巨大,是支撑自身发展的底层动力。因此,对于算力不足、「烧不起」大模型的客户而言,算力层面决定了他们用得起用不起。此次千帆 2.0 用最佳的算力效能,让客户在训练大模型时不再有或更少有算力上的压力。一方面千帆 2.0 在分布式并行训练策略加持下,万卡规模集群的加速比达到 95%,整体算力充分释放。另一方面关注万卡集群的运行效率,内置高效的集群组网故障排除机制,能够快速完成故障定位和恢复,在效率上几乎拉满。国内外不同厂商不同代际的芯片实现了同一平台混合部署、高效配合使用,进一步突破算力桎梏。安全性也是使用大模型时面临的一大挑战,输入输出内容、使用数据是否合法合规、违背伦理规范,这些都要给予重视。千帆 2.0 用企业级安全全方位把控大模型的模型、内容和数据安全,成为唯一一个提供最完备大模型安全方案的平台。可以看到,从底层算力、中间层工具链到顶层大模型,千帆 2.0 做到了环环相扣。正如沈抖所言,千帆 2.0 的一切升级为了让客户更方便地用上、用好大模型。千帆已赋能十余个行业
400 多个业务场景
随着技术的不断进步,人们看到了 AI 时代大模型大规模落地的可行性。此前 AI 就像「空中楼阁」,研发成本高、投入时间长、对人才的需求量大…… 大模型落地很困难,实用性更是无从谈起。不仅如此,对于一些非 IT、互联网公司来说,想要让新技术赋能自家产品,从头开始研发耗费巨大。这时,如果将 AI 大厂研发的技术和其公司的产品相结合,可以达到事半功倍的效果。这段时间以来,我们已经见证了一些生产力工具正在被 AI 重新改写(如搜索引擎),大模型正在给我们的学习、办公等各个方面带来便利,例如它能生成文本、帮助码农编写一段代码、根据对话生成图片……虽然大模型如雨后春笋般不断崛起,其带来的便利也真真正正的影响到了很多人。但对于垂直行业来说,如何将大模型的能力与行业场景有效结合成为摆在赛道玩家们面前的一道课题,也是一道难题。很多人认为可适用于任何场景的大模型才是最优模型,然而事实并非如此。大模型适用任何场景是有代价的,可能会缺乏行业深度,无法保证数据隐私和安全、输出答案的真实性无法保证。同时通用大模型普遍参数量巨大,对算力要求极高。如今我们可看到,百度智能云开始在垂直行业发力。千帆 2.0 已经在政务、金融、工业、交通等十余个行业落地应用。百度智能云打造的「九州」基于大模型能力全面重构,实现了更加智能化的一网统管、一网通办、一网协同。只需要⼀句话、⼀个问题,大模型就能根据需要生成洞察,发现问题的根因,同时给出处置建议,从而实现更加精细化的城市治理。小到公文写作,大到部门统筹、决策支撑,「九州」让政务人员的办公效率提升了几十倍。千帆 2.0 不仅为政务带来了便利,在工业领域也效果显著。百度智能云提出了基于大模型重构的百度智能云工业解决方案 ——「开物」,实现了产线优化向产业链优化跃进。除了政务和工业外,我们还看到千帆 2.0 在金融、智能交通等领域的成功落地。- 基于大模型重构的百度智能云金融解决方案 —— 开元,可以帮助金融机构提升运营效率和业务质量。
- 基于大模型全面重构的百度智能云智能交通解决方案 —— ACE3.0 ,利用了大模型强大的知识压缩能力,将车、路、云、图的基本能力和交通全要素进行了聚合和泛化升级,形成了具有领先优势的智能交通「中国方案」。
除了上述行业垂直解决方案外,百度智能云还正式推出跨行业的 AI 原生应用 Family,包含 11 个 AI 原生应用产品,重点覆盖服务营销、办公提效、生产优化三大领域。其中升级了曦灵数字人平台、发布企业搜索引擎甄知和安全生产智能助手度安安,以及其余八个应用产品。首先在服务营销领域,百度智能云曦灵数字人平台进行了「形、神」两大升级。在形象方面,可用原来三分之一的成本、十分之一的制作周期,渲染出媲美好莱坞级别的高清 3D 数字人,并且曦灵是目前全行业唯一能用数字人来做服装展示的平台。在人设及灵魂上,升级后的数字人将拥有强大的通识知识,并融会贯通金融、文旅、电商等各领域专业知识,塑造个性化人设。此外,百度智能云也针对金融、电商等领域训练出了「模板数字员工」,只需企业稍微调试一下,这些数字人就可以「上岗」了。在办公提效方面,百度智能云推出了基于大模型重构的全新企业搜索引擎百度智能云甄知。该产品可帮助员工跨模态、跨应用的迅速找到想要的内容,此外借助该产品还可实现知识找人,它能向员工推送他可能感兴趣的文档,辅助员工持续学习。在生产优化领域,百度智能云重磅发布了安全生产智能助手度安安。让大模型帮助企业进行安全管理,从感知智能升级为决策智能,大幅提升安全生产监控效率和决策质量。过去,安全生产面临三大难题:一是安全制度太繁琐,安全培训时工人们根本记不住,遇到紧急情况又来不及查资料,从而造成错误;二是告警信息太多,工人们看不过来;三是经验丰富的老师傅太少。为了解决上述问题,百度智能云把各种安全制度、预警信息和老师傅的经验全部用来训练大模型,从而推出了懂安全生产的度安安。它可以把各种安全预警归类总结,整理地清清楚楚;可以自动生成检修工单,迅速回答工人们用自然语言咨询的各种安全问题。2023 年已经过去了大半,大模型这股 AI 技术浪潮方兴未艾,并正在从单纯追求性能提升进入到广泛寻求落地的关键阶段。但其实大模型落地应用有个很大难题,就是很多企业不知道在哪些场景利用大模型,然后才是不知道如何用上大模型。百度智能云在今天大会上一系列的发布,有一个重要的目标,就是希望能为「大模型应用」打个样,让大家看到大模型在诸如营销、办公等场景带来的机遇,从而积极参与进来,进一步催生出「大模型应用」繁荣生态。百度智能云对千帆的目标是成为最好用的大模型平台,从而吸引越来越多的企业能够借助千帆平台,打造出更多、更好的大模型产品。在我们看来,「千帆」之名有更深一层的意义,在于百度智能云为更多企业架起「千帆」,加速「大模型落地」。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]